[發明專利]字符區域提取裝置、具備字符區域提取功能的攝像裝置以及字符區域提取程序有效
| 申請號: | 200880131943.0 | 申請日: | 2008-11-12 |
| 公開(公告)號: | CN102209969A | 公開(公告)日: | 2011-10-05 |
| 發明(設計)人: | 原伸之;藤井勇作;武部浩明;藤本克仁;堀田悅伸;皆川明洋 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06K9/38 | 分類號: | G06K9/38 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 李偉;王軼 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符 區域 提取 裝置 具備 功能 攝像 以及 程序 | ||
技術領域
本發明涉及從圖像數據提取字符區域的處理。具體來講,涉及為了從對被攝體進行攝像而得到的圖像數據取得作為字符識別處理對象的二值圖像數據,即使從由于環境光的映射而發生了反射的圖像數據也能夠高精度地提取字符區域的處理。
字符區域是被分類成字符像素的像素區域。將按照相同的基線排列的一個或者多個字符區域稱為“行”。
背景技術
在小型數碼相機、搭載有相機功能的手機等已經普及的今天,對于相機攝影功能,正在追求高精度的字符識別功能。
對于以往的字符識別處理的對象圖像數據來說,由于是利用掃描儀等固定裝置來對被攝體進行攝像,所以是在沒有干擾的攝影環境下得到的數據。
但是,由于小型數碼相機、手機等在室內室外均可以利用,所以需要考慮攝影時的干擾影響變大的情況。作為較嚴重的問題之一,尤其是存在如下現象:由于被攝體的表面存在具有較高反射率的玻璃或塑料等材料而導致在攝影圖像上發生照明光的反射,從而會使視覺辨認度、字符識別精度下降。
這種現象產生的原因在于,在反射部分處背景和字符的濃淡值均上升,而兩者的對比度下降,從而成為與非反射區域處的背景和字符的對比度不同的狀態,因此分離處理的精度下降。另外,該現象也會發生在背景、字符沒有復雜圖案的比較均勻的情況下。
作為對發生了反射的攝影圖像補充反射區域的背景色和字符色,從
在專利文獻1中,根據局部的邊沿強度來分離字符和背景區域,使用根據各區域所屬的像素推定出的背景色和字符色并根據濃淡進行修正來分離字符和背景。
另外,在專利文獻2中,根據輸入圖像的濃淡值直方圖來推定背景色從而分離字符和背景色,將具有比該背景色高的濃淡值的區域作為反射區域部,根據濃淡值分布直方圖來推定反射區域內的背景色,通過以推定結果為基礎分離字符和背景來求出包含反射區域的圖像整體的字符區域。
專利文獻1:日本特開2008-113446號公報
專利文獻2:日本特開2008-79258號公報
但是,在具有反射區域的圖像中,除了字符和背景的邊界之外,在反射區域和非反射區域的邊界處也會產生邊沿。因此,在專利文獻1中,考慮到如下情況,即有時會將在背景區域上產生的反射區域和非反射區域的邊沿誤檢測為字符區域的一部分,從而導致字符區域提取的精度下降,進而導致字符識別處理中的識別精度下降。
另外,在專利文獻2中,考慮到如下情況,即在屬于字符區域和背景區域的像素的濃淡值在各區域內不均勻的情況下,無法在直方圖上檢測出分離處理的合理的閾值。另外,由于不進行閾值的評價和基于評價的修正,所以字符區域和背景區域的分離精度下降,導致字符區域提取精度下降,進而導致字符識別處理中的識別精度下降。
發明內容
鑒于上述問題,本發明的目的在于,提供一種字符區域提取裝置、具備字符區域提取功能的攝像裝置以及字符區域提取程序,能夠從產生了如反射區域那樣的、具有與圖像數據整體的濃淡值傾向不同的傾向的區域的圖像數據中高精度地分離出字符區域。
作為本發明的一個方面的字符區域提取裝置輸入成為處理對象的圖像數據,使用根據圖像數據整體的濃淡值而決定的第1閾值將圖像數據整體二值化,并分離成像素值飽和的反射區域和像素值不飽和的非反射區域。
并且,將反射區域和非反射區域分別使用單獨的閾值(第2閾值、第3閾值)進行二值化處理,從而分離成字符區域和背景區域。
并且,對分別在反射區域和非反射區域中被分離出的字符區域進行合并,求出圖像數據整體的字符區域,并提取字符區域的位置信息。
這里,在上述的第1閾值~第3閾值不合理的情況下,反射區域和非反射區域的分離處理的處理精度下降,進而分別分離反射區域和非反射區域中的字符區域和背景區域的處理的處理精度下降。例如,在對字符區域進行合并時,字符筆劃的連接變得不連續,會存在產生部分缺失之類的問題。因此,使用反射區域和非反射區域中的分離結果來評價二值化處理中使用的第1閾值~第3閾值。在根據規定的評價條件將分離結果判定為不合理的情況下,對與該分離結果相關的閾值進行調整,并再次進行二值化分離處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/200880131943.0/2.html,轉載請聲明來源鉆瓜專利網。





