[發(fā)明專利]一種基于視覺的圖書盤點(diǎn)系統(tǒng)的書脊提取方法及裝置有效

申請(qǐng)?zhí)枺?/td>	202010182948.9	申請(qǐng)日：	2020-03-16
公開（公告）號(hào)：	CN111368856B	公開（公告）日：	2023-07-11
發(fā)明（設(shè)計(jì)）人：	蔡君;劉高聯(lián);廖麗平;付鴻添;吳夢瑩	申請(qǐng)（專利權(quán)）人：	廣東技術(shù)師范大學(xué);廣東省星溪智能科技有限公司
主分類號(hào)：	G06V10/44	分類號(hào)：	G06V10/44;G06V10/24;G06V10/36;G06V10/82;G06N3/0464
代理公司：	廣州高航知識(shí)產(chǎn)權(quán)代理有限公司 11530	代理人：	趙永強(qiáng)
地址：	510630 廣東省***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種基于視覺圖書盤點(diǎn) 系統(tǒng) 書脊提取方法裝置
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開了一種視覺圖書盤點(diǎn)系統(tǒng)的書脊提取方法，包括：采集書脊圖像；對(duì)采集到的圖像做保邊濾波預(yù)處理；對(duì)經(jīng)過預(yù)處理的圖像做書脊包圍框的標(biāo)注，獲得書脊位置的強(qiáng)監(jiān)督信息；改造MaskRCNN模型，獲得多個(gè)不同組件，按照具體實(shí)施例中的策略連接起來，命名為CMR模型；利用標(biāo)注過的圖像訓(xùn)練CMR模型，優(yōu)化該模型里面的參數(shù)；利用優(yōu)化好的CMR模型，對(duì)采集到的圖像做前向推斷，得到書脊掩碼；根據(jù)書脊掩碼擬合矩形框，將書脊提取出來；利用本發(fā)明可以提高書脊圖像信噪比和書脊提取精度。

技術(shù)領(lǐng)域

本發(fā)明涉及圖書自動(dòng)盤點(diǎn)技術(shù)領(lǐng)域，尤其涉及一種基于視覺的圖書盤點(diǎn)系統(tǒng)的書脊提取方法及裝置。

背景技術(shù)

基于計(jì)算機(jī)視覺的圖書盤點(diǎn)系統(tǒng)主要應(yīng)用于大中型圖書館的圖書盤點(diǎn)工作。該系統(tǒng)通過圖像處理、深度學(xué)習(xí)等多種技術(shù)來識(shí)別移動(dòng)機(jī)器人拍攝的書脊圖像，可以完成圖書的自動(dòng)化盤點(diǎn)。

為了識(shí)別書脊，首先需要對(duì)圖像進(jìn)行書脊提取，然后再來識(shí)別書脊，最后獲取圖書信息。書脊提取的準(zhǔn)確率，從根本上影響盤點(diǎn)系統(tǒng)的準(zhǔn)確率，因此，書脊提取準(zhǔn)確率的提升，一直是基于視覺的圖書盤點(diǎn)系統(tǒng)的重點(diǎn)研究方向。

書脊提取前，有必要對(duì)采集到的原始圖像做預(yù)處理，主要目的是為了濾除噪聲；一般的預(yù)處理方法主要采用高斯算子實(shí)現(xiàn)低通濾波。高斯算子本質(zhì)上是一種按照二維高斯分布構(gòu)建的加權(quán)矩陣，離目標(biāo)像素越近的點(diǎn)對(duì)最終結(jié)果的貢獻(xiàn)越大，反之則越??；通過在原始書脊圖像上滑動(dòng)該加權(quán)矩陣即可將高頻噪聲濾除，效果非常不錯(cuò)；但由于高斯算子只考慮了空間分布，沒有考慮到像素值的差異，這樣就會(huì)導(dǎo)致在濾除高頻噪聲的同時(shí)，把書脊上灰度變化劇烈的地方，比如文字、紋理和縫隙等重要的高頻信號(hào)也濾除掉，圖像信噪比其實(shí)并不高。從肉眼上看，表現(xiàn)為整張圖像變模糊，顯然不利于盤點(diǎn)系統(tǒng)后續(xù)的書脊提取、文字識(shí)別和特征匹配等操作。

預(yù)處理后，一般進(jìn)行書脊提取。觀察拍攝所得圖像，可以發(fā)現(xiàn)書脊之間由縫隙隔開?？p隙本質(zhì)是一條直線，因此可通過檢測直線來提取書脊。若采用Hough變換檢測直線，由于Hough變換對(duì)算法參數(shù)十分敏感，所以針對(duì)不同的圖像，當(dāng)參數(shù)設(shè)置不對(duì)時(shí)，極易造成非書脊邊緣的誤檢，從而導(dǎo)致書脊提取失敗。而直線段檢測算法(Line?Segment?Detector，LSD)算法是基于圖像梯度處理的一種直線檢測算法，它能在線性的時(shí)間內(nèi)得出亞像素級(jí)精度的檢測結(jié)果；所以，目前在視覺圖書盤點(diǎn)系統(tǒng)中，普遍用LSD算法檢測直線，實(shí)現(xiàn)書脊提取。其特征在于，Sobel算子增強(qiáng)書脊縫隙后，先用LSD從圖像中檢出若干條直線，接著基于先驗(yàn)信息，設(shè)計(jì)一系列規(guī)則濾除誤檢直線，擬合出書脊包圍框，最后根據(jù)書脊包圍框?qū)固崛〕鰜怼?/p>

盡管LSD算法的精度和速度都優(yōu)于Hough變換，但同樣存在對(duì)噪聲敏感的問題，直線檢測或多或少都會(huì)存在錯(cuò)檢或漏檢，提取準(zhǔn)確率依舊不是很高。其原因在于，首先，圖像中的書脊具有尺度大，排布密集，方向旋轉(zhuǎn)，顏色多樣和透視畸變等特點(diǎn)，這就使得圖像充滿大量噪聲，最典型的干擾來自書脊上的文字；文字本來屬于書脊的重要特征，但直線檢測算法只能把握單一的縫隙特征，反而使得文字成為書脊提取的最大干擾?；谥本€檢測的方法無法全面把握書脊的各種特征，這是提取精度不高的核心原因。其次，移動(dòng)機(jī)器人在行進(jìn)過程中，鏡頭抖動(dòng)會(huì)導(dǎo)致書脊圖像光照不均甚至出現(xiàn)拖影，降低圖像質(zhì)量。所以，基于以上討論，不難發(fā)現(xiàn)，通過檢測書脊縫隙直線來提取書脊，是無法適應(yīng)書脊圖像復(fù)雜性的。

發(fā)明內(nèi)容

本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一。為此，本發(fā)明公開了一種基于視覺的圖書盤點(diǎn)系統(tǒng)的書脊提取方法，包括以下步驟：

步驟1，通過移動(dòng)機(jī)器人采集書脊圖像并對(duì)采集到的圖像做保邊濾波預(yù)處理，提高系統(tǒng)信噪比，再對(duì)采集圖像做形變矯正；

步驟2，對(duì)經(jīng)過預(yù)處理的圖像做書脊包圍框的標(biāo)注，獲得書脊位置的強(qiáng)監(jiān)督信息；

步驟3，構(gòu)建改造型MaskRCNN模型，獲得多個(gè)不同組件，按照預(yù)設(shè)的策略連接起來，命名為CMR模型；

步驟4，利用標(biāo)注過的圖像訓(xùn)練CMR模型，優(yōu)化該模型里面的參數(shù)；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東技術(shù)師范大學(xué);廣東省星溪智能科技有限公司，未經(jīng)廣東技術(shù)師范大學(xué);廣東省星溪智能科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.17sss.com.cn/pat/books/202010182948.9/2.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

上一篇：一種太陽能面板
下一篇：一種智能門鎖劫持功能標(biāo)記與通知的方法及系統(tǒng)

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】