[發明專利]字符識別模型的訓練方法、字符識別方法及裝置在審
| 申請號: | 201910872956.3 | 申請日: | 2019-09-16 |
| 公開(公告)號: | CN110610177A | 公開(公告)日: | 2019-12-24 |
| 發明(設計)人: | 林鋒鋒 | 申請(專利權)人: | 卓爾智聯(武漢)研究院有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/34;G06K9/62;G06N3/04 |
| 代理公司: | 11270 北京派特恩知識產權代理有限公司 | 代理人: | 李梅香;張穎玲 |
| 地址: | 432200 湖北省武漢市黃陂區盤龍城經*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本圖像 字符識別 目標數據 字符區域 算法 標注 卷積神經網絡 字符區域檢測 第二位置 第一位置 極值區域 | ||
本發明提供了一種字符識別模型的訓練方法、字符識別方法及裝置。其中,所述字符識別模型的訓練方法包括:利用最大穩定極值區域(MSER)算法對樣本圖像進行字符區域檢測,得到所述樣本圖像中的第一字符區域;利用包含區域卷積神經網絡(RCNN)算法的字符識別模型對所述第一字符區域進行字符識別,得到所述樣本圖像對應的目標數據;所述目標數據至少包括:所述第一字符的第一識別結果及所述第一字符在所述樣本圖像中的第一位置信息;基于所述目標數據和所述樣本圖像對應的標注數據,對所述字符識別模型進行訓練;所述標注數據至少包括:所述第一字符的第二識別結果及所述第一字符在所述樣本圖像中的第二位置信息。
技術領域
本發明涉及圖像處理領域,尤其涉及一種字符識別模型的訓練方法、字符識別方法及裝置。
背景技術
目前,圖像中的字符識別已經取得了巨大的進步,并且得到了廣泛的應用。隨著智能手機和移動拍攝設備的普及,帶有自然場景的圖像的數量越來越多。然而,由于自然場景圖像中的字符外觀的多樣性和背景的復雜性,如何對自然場景中字符進行準確、高效檢測依然是一個具有挑戰性的任務。
發明內容
本發明實施例提供一種字符識別模型的訓練方法、字符識別方法及裝置,能夠實現用于完成字符識別的字符識別模型的訓練,以利用該字符識別模型對復雜場景圖像中的字符進行準確、高效的識別。
本發明實施例提供一種字符識別模型的訓練方法,包括:
利用最大穩定極值區域(MSER,Maximally Stable Extremal Regions)算法對樣本圖像進行字符區域檢測,得到所述樣本圖像中的第一字符區域;利用包含區域卷積神經網絡(RCNN,Regions with Convolutional Neural Networks features)算法的字符識別模型對所述第一字符區域進行字符識別,得到所述樣本圖像對應的目標數據;所述目標數據至少包括:所述第一字符的第一識別結果及所述第一字符在所述樣本圖像中的第一位置信息;基于所述目標數據和所述樣本圖像對應的標注數據,對所述字符識別模型進行訓練;所述標注數據至少包括:所述第一字符的第二識別結果及所述第一字符在所述樣本圖像中的第二位置信息。
上述方案中,所述利用MSER算法對樣本圖像進行字符區域檢測,得到所述樣本圖像中的第一字符區域,包括:
利用MSER算法對所述樣本圖像進行字符區域檢測,得到所述樣本圖像中包含字符的候選區域;
對所述候選區域進行垂直投影,得到至少一個字符區域;
針對得到的至少一個字符區域的每個字符區域,根據相應字符區域,結合聚類算法,確定所述樣本圖像中相應字符區域所對應字符所屬的行區域;
當行區域包含多個字符時,基于第一距離,對行區域中的多個字符對應的多個字符區域進行合并,得到第一字符區域;所述第一距離表征相鄰字符間的距離;
當行區域包含一個字符時,將一個字符對應的字符區域作為第一字符區域。
上述方案中,所述方法還包括:
對所述樣本圖像按照預設規則進行標注處理,得到所述樣本圖像對應的標注數據;
根據所述標注數據對樣本圖像進行過濾處理,得到過濾后的樣本圖像;
所述利用MSER算法對樣本圖像進行字符區域檢測,得到所述樣本圖像中的第一字符區域時,包括:
利用MSER算法對過濾后的樣本圖像進行字符區域檢測,得到所述樣本圖像中的第一字符區域。
上述方案中,所述基于所述目標數據和所述樣本圖像對應的標注數據,對所述字符識別模型進行訓練,包括:
基于所述目標數據和所述樣本圖像對應的標注數據,確定各損失函數的值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于卓爾智聯(武漢)研究院有限公司,未經卓爾智聯(武漢)研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201910872956.3/2.html,轉載請聲明來源鉆瓜專利網。





