[發(fā)明專利]一種基于交互式分割的低對(duì)比度沖壓字符識(shí)別算法在審
| 申請(qǐng)?zhí)枺?/td> | 201811214228.5 | 申請(qǐng)日: | 2018-10-18 |
| 公開(公告)號(hào): | CN109543673A | 公開(公告)日: | 2019-03-29 |
| 發(fā)明(設(shè)計(jì))人: | 游照林;向忠;錢淼;胡旭東 | 申請(qǐng)(專利權(quán))人: | 浙江理工大學(xué) |
| 主分類號(hào): | G06K9/32 | 分類號(hào): | G06K9/32;G06K9/34;G06K9/46 |
| 代理公司: | 紹興市知衡專利代理事務(wù)所(普通合伙) 33277 | 代理人: | 施春宜 |
| 地址: | 310018 浙江省杭州市杭*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 沖壓 低對(duì)比度 交互式分割 字符識(shí)別算法 特征提取 灰度 三層BP神經(jīng)網(wǎng)絡(luò) 液化石油氣鋼瓶 動(dòng)態(tài)閾值調(diào)整 二值化圖像 字符歸一化 閉環(huán)回路 單個(gè)字符 灰度投影 累加圖像 傾斜校正 特征輸入 提取容器 圖像水平 字符分割 垂直的 二值化 歸一化 魯棒性 識(shí)別率 投影圖 校正圖 自適應(yīng) 山谷 分割 | ||
1.一種基于交互式分割的低對(duì)比度沖壓字符識(shí)別算法,其特征在于:包括以下幾個(gè)步驟:
(1)交互式分割:采用MeanShift圖像分割算法分割輸入圖像,用戶標(biāo)記背景及包含字符的目標(biāo)鋼瓶,采用最大相似性估計(jì)方法進(jìn)行同質(zhì)化區(qū)域融合,最終分割出包含字符的液化石油氣鋼瓶,去除復(fù)雜背景干擾;
(2)自適應(yīng)傾斜校正:通過訓(xùn)練包含三層的卷積神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)能夠定位并提取理想的字符邊緣;通過訓(xùn)練大量的傾斜圖像,該網(wǎng)絡(luò)能夠?qū)崿F(xiàn)對(duì)步驟步驟(1)的結(jié)果圖進(jìn)行自適應(yīng)傾斜校正的目的;
(3)閉環(huán)回路二值化:通過閉環(huán)回路,調(diào)整二維熵的動(dòng)態(tài)范圍,找出二維熵的最低值,其對(duì)應(yīng)于最好的閾值化圖像效果;
(4)灰度投影及字符歸一化:步驟(3)所得到的二值化圖像進(jìn)行灰度投影,根據(jù)灰度投影圖的山谷和山峰位置,精確定位并分割出單個(gè)沖壓字符,所得的單個(gè)字符歸一化到同一大小;
(5)特征提取與識(shí)別:采用HOG特征提取容器,對(duì)步驟(4)所得的字符進(jìn)行特征提取,將提取的特征輸入到三層BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練識(shí)別。
2.如權(quán)利要求1所述的基于交互式分割的低對(duì)比度沖壓字符識(shí)別算法,其特征在于:所述步驟(1)中,MeanShift圖像分割算法具體為:將復(fù)雜的背景通過粗化提取整體信息,進(jìn)而將圖像分割;對(duì)屬于同一物體的子區(qū)域,計(jì)算顏色直方圖并進(jìn)行相似性估計(jì)以實(shí)現(xiàn)子區(qū)域融合;將顏色直方圖分為16*16*16=4096個(gè)區(qū)間,定義不同區(qū)域R和區(qū)域Q的相似性估計(jì)方法,計(jì)算公式如下:
其中u表示直方圖區(qū)間數(shù),表示區(qū)間R的歸一化顏色直方圖,表示區(qū)間Q的歸一化顏色直方圖,p(R,Q)表示區(qū)域R,Q的相似性估計(jì)值。
3.如權(quán)利要求1所述的基于交互式分割的低對(duì)比度沖壓字符識(shí)別算法,其特征在于:所述步驟(1)中,卷積神經(jīng)網(wǎng)絡(luò)包括卷積層,池化層和全連接層;該卷積神經(jīng)網(wǎng)絡(luò)具有參數(shù)共享和局部感知的功能,每個(gè)神經(jīng)元對(duì)局部進(jìn)行感知,然后在高層將局部的信息綜合起來得到全局的信息。
4.如權(quán)利要求1所述的基于交互式分割的低對(duì)比度沖壓字符識(shí)別算法,其特征在于:所述步驟(3)中,利用二維熵來顯示閾值化后黑白像素的分布情況,進(jìn)而調(diào)整控制回路;二維熵值越小,對(duì)應(yīng)該圖像質(zhì)量越好,該時(shí)刻使用的閾值越好;二維熵的計(jì)算公式如下:
5.如權(quán)利要求1所述的基于交互式分割的低對(duì)比度沖壓字符識(shí)別算法,其特征在于:所述步驟(4)中,先對(duì)自適應(yīng)閾值后的輸出圖像進(jìn)行水平投影,分割出單行字符,然后再進(jìn)行垂直投影,分割出單個(gè)字符,之后將單個(gè)字符歸一化為30*30像素大小;灰度投影法計(jì)算公式如下:
其中M,N分別是圖像寬度和高度;dst(x,y)表示需要進(jìn)行灰度投影的圖像,ph(y)表示水平投影函數(shù),y=0,1,...N;Ph(y)表示垂直投影函數(shù),x=0,1,...M。
6.如權(quán)利要求1所述的基于交互式分割的低對(duì)比度沖壓字符識(shí)別算法,其特征在于:所述步驟(5),采用HOG特征提取器進(jìn)行特征提取,特征的提取步驟如下:首先計(jì)算圖像的梯度,計(jì)算公式如下:
G(x,y)=I(x+1,y)-I(x-1,y)
G(x,y)=I(x,y+1)-I(x,y-1)
Gx(x,y),Gy(x,y)分別表示圖像中像素點(diǎn)(x,y)在水平方向上和垂直方向上的梯度;像素點(diǎn)(x,y)處的梯度幅值和梯度方向計(jì)算公式如下:
其中G(x,y)表示像素點(diǎn)(x,y)的梯度幅值,θ(x,y)表示像素點(diǎn)(x,y)的剃度方向;
然后將輸入圖分成若干個(gè)mc×mc的單元,用9個(gè)區(qū)間統(tǒng)計(jì)每個(gè)單元中像素點(diǎn)的梯度,即將360°分為9個(gè)不同的方向塊,將屬于同一梯度方向區(qū)間的像素歸為一個(gè)區(qū)間中;
最后,將提取的特征輸入到三層BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練識(shí)別,BP神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元個(gè)數(shù)為提取的特征維數(shù),輸出層神經(jīng)元個(gè)數(shù)為分類數(shù),隱含層神經(jīng)元個(gè)數(shù)可由經(jīng)驗(yàn)公式計(jì)算如下:
其中式中,q表示隱藏層節(jié)點(diǎn)的數(shù)量,d表示字符特征的維數(shù),l表示分類數(shù)目。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江理工大學(xué),未經(jīng)浙江理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201811214228.5/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種連接器端子的自動(dòng)沖壓工藝及其設(shè)備
- 一種塑件沖壓機(jī)
- 一種應(yīng)用于電機(jī)定轉(zhuǎn)子片生產(chǎn)的沖壓設(shè)備
- 一種用于電機(jī)沖片生產(chǎn)的沖壓裝置
- 一種應(yīng)用于電機(jī)定轉(zhuǎn)子片生產(chǎn)的沖壓設(shè)備
- 一種不銹鋼圓筒件自動(dòng)沖壓系統(tǒng)及其沖壓方法
- 一種適用不同尺寸不銹鋼圓筒件的自動(dòng)沖壓系統(tǒng)及方法
- 一種適用不同尺寸不銹鋼圓筒件的自動(dòng)沖壓裝置
- 適用于生產(chǎn)錘子的沖壓設(shè)備
- 可更換沖壓頭的氣動(dòng)沖壓模具
- 用于使用多重掃描技術(shù)進(jìn)行欺詐檢測的裝置、系統(tǒng)和方法
- 含多類型標(biāo)識(shí)的信息載體的識(shí)別方法
- 一種字符識(shí)別方法及系統(tǒng)
- 字符識(shí)別處理方法及裝置
- 對(duì)字符圖像進(jìn)行處理的裝置、方法和介質(zhì)
- 字符識(shí)別模板匹配方法、裝置和文本識(shí)別設(shè)備
- 字符識(shí)別模型的訓(xùn)練方法、字符識(shí)別方法及裝置
- 實(shí)現(xiàn)光學(xué)字符識(shí)別的終端設(shè)備確定方法及裝置
- 字符識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 字符識(shí)別模型生成系統(tǒng)、方法、裝置和計(jì)算機(jī)設(shè)備





