[發明專利]營業執照版面分析方法及裝置在審
| 申請號: | 201611200465.7 | 申請日: | 2016-12-22 |
| 公開(公告)號: | CN106815561A | 公開(公告)日: | 2017-06-09 |
| 發明(設計)人: | 楊羿 | 申請(專利權)人: | 北京五八信息技術有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司11205 | 代理人: | 楊澤,劉芳 |
| 地址: | 100083 北京市海淀區學清*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 營業執照 版面 分析 方法 裝置 | ||
技術領域
本申請實施例涉及圖像分析技術,尤其涉及一種營業執照版面分析方法及裝置。
背景技術
營業執照是企業或組織合法經營權的憑證,用于證明企業或組織的經濟實力、資質及信譽等。一般由企業或組織向工商行政管理機構提出申請,經過一系復雜的手續,由工商行政管理機構頒發。由于營業執照的申請過程復雜,而且申請人必須符合一定的條件,因此,很多不法分子通過偽造營業執照進行非法經營。
為防止不法分子偽造營業執照,需要對營業執照進行版面分析,從而對營業執照進行審核。然而,目前市面上的文字識別軟件僅針對普通便攜式文檔格式(Portable Document Format,PDF)或文檔進行結構分析,并沒有針對營業執照進行版面分析的方法。若采用分析PDF或文檔的文字識別軟件對營業執照進行分析,則分析準確率低。
發明內容
本申請實施例提供一種營業執照版面分析方法及裝置,通過提取營業執照的連通域,實現對營業執照版面分析的目的。
第一方面,本申請實施例提供一種營業執照版面分析方法,包括:
確定營業執照中的至少一個連通域;
確定所述至少一個連通域中每個連通域的外接矩形,以得到至少一個外接矩形;
根據所述至少一個外接矩形,確定預設字符的定位軸,所述營業執照中的字符包括所述預設字符;
根據所述定位軸,分割所述營業執照的內容,將所述營業執照的內容分割成至少一個字符;
根據所述至少一個字符,對所述營業執照進行版面分析。
在一種可行的實現方式中,所述確定營業執照中的至少一個連通域之前,還包括:
獲取所述營業執照的二值化圖像;
所述確定營業執照中的至少一個連通域,包括:
確定所述二值化圖像中的至少一個連通域。
在一種可行的實現方式中,所述根據所述至少一個外接矩形,確定預設字符的定位軸之前,還包括:
過濾所述至少一個外接矩形,以得到所述至少一個外接矩形中符合條件的外接矩形。
在一種可行的實現方式中,所述符合條件的外接矩形包括:像素數量小于第一閾值的外接矩形、橫縱比小于第二閾值的外接矩形、包含的連通域的個數小于第三閾值的外接矩形。
在一種可行的實現方式中,所述根據所述至少一個外接矩形,確定預設字符的定位軸,包括:對所述至少一個外接矩形中的每個外接矩形提取圖像特征,以得到圖像特征集;提取所述預設字符的圖像特征;從所述圖像特征集中確定出與所述預設字符的圖像特征最接近的圖像特征,將所述最接近的圖像對應的外接矩形作為所述預設字符的定位軸。
在一種可行的實現方式中,所述根據所述定位軸,分割所述營業執照的內容,將所述營業執照的內容分割成至少一個字符,包括:根據所述定位軸,將所述營業執照的內容分割成至少一個字符串;將所述至少一個字符串中的每個字符串映射到所述營業執照中,以得到映射字符串后的營業執照;以行為單位從所述映射字符串后的營業執照中提取至少一個行字符串;對所述至少一個行字符串中的每個行字符串進行分割,以得到所述至少一個字符。
第二方面,本申請實施例提供一種營業執照版面分析裝置,包括:
處理模塊,用于確定營業執照中的至少一個連通域;
外接矩形確定模塊,用于確定所述至少一個連通域中每個連通域的外接矩形,以得到至少一個外接矩形;
定位軸確定模塊,用于根據所述至少一個外接矩形,確定預設字符的定位軸,所述營業執照中的字符包括所述預設字符;
分割模塊,用于根據所述定位軸,分割所述營業執照的內容,將所述營業執照的內容分割成至少一個字符;
分析模塊,用于根據所述至少一個字符,對所述營業執照進行版面分析。
在一種可行的實現方式中,所述處理模塊,用于獲取所述營業執照的二值化圖像,確定所述二值化圖像中的至少一個連通域。
在一種可行的實現方式中,所述外接矩形確定模塊,還用于在所述定位軸確定模塊根據所述至少一個外接矩形,確定預設字符的定位軸之前,過濾所述至少一個外接矩形,以得到所述至少一個外接矩形中符合條件的外接矩形。
在一種可行的實現方式中,所述符合條件的外接矩形包括:像素數量小于第一閾值的外接矩形、橫縱比小于第二閾值的外接矩形、包含的連通域的個數小于第三閾值的外接矩形。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京五八信息技術有限公司,未經北京五八信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201611200465.7/2.html,轉載請聲明來源鉆瓜專利網。





