[發(fā)明專利]基于部首的書法字檢索方法無效
| 申請?zhí)枺?/td> | 201210123122.0 | 申請日: | 2012-04-24 |
| 公開(公告)號: | CN102663127A | 公開(公告)日: | 2012-09-12 |
| 發(fā)明(設計)人: | 莊越挺;吳江琴;夏洋;高鵬程;林媛 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 張法高 |
| 地址: | 310027 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 部首 書法 檢索 方法 | ||
技術領域
本發(fā)明涉及書法字相關信息庫的建立,尤其涉及一種基于部首的書法字檢索的方法。
背景技術
書法是中國土生土長的藝術,有著悠久、深厚的文化底蘊。古代大量的優(yōu)秀書法作品都是全人類寶貴的歷史文化遺產。數字化的書法作品可以通過作品名稱、作者和朝代等信息進行檢索,?但這遠遠滿足不了人們的需求,而書法作品圖像難以通過OCR識別,基于內容的書法字檢索相對較難,原因在于書法字具有如下特性:1)筆劃變形。橫筆不平,豎筆不直,折筆拐角變圓弧。有時是為美感而故意扭曲筆畫,如枯筆字。2)復雜性。書法字風格各異。與印刷體相比,該連接的筆畫沒接上,不該接的卻連接在一起。3)模糊性。由于原始作品飽經歷史滄桑,或受自然因素影響,有許多腐蝕和污染的地方,嚴重的甚至出現(xiàn)部分筆畫缺失的現(xiàn)象。目前書法字檢索技術的研究成果很少。?MultiMedia?2004年(Retrieval?of?Chinese?calligraphic?charcter?image?2004:?17-24)提出一種對書法字的檢索多采用基于輪廓相似性的方法。為了加快檢索速度,第十五屆ACM?International?Conference?on?Information?and?Knowledge?Management?2006,(Towards?interactive?indexing?for?large?Chinese?calligraphic?character?databases?2006:?884-885)對書法字數據庫的高維特征建理論上,?基于內容的書法字檢索與基于內容的圖像檢索(?content?based?image?retrieval,?CBIR)?十分接近。CBIR?通常是通過比較顏色、紋理和形狀等特征實現(xiàn)的。?但是對于書法字來說,?在這3個特征中,?僅形狀特征是有意義的。?《計算機輔助設計與圖形學學報》2009年(基于骨架相似性的書法字檢索)提出一種基于骨架的書法字檢索方法,將書法字進行細化形成骨架,再對骨架進行特征提取及匹配,達到檢索目的,但是真正實施起來書法字的骨架提取難度特別大,而且提取出來的骨架并不規(guī)整,檢索速度比較慢。
發(fā)明內容
本發(fā)明的目的是克服現(xiàn)有技術的不足,結合中國人對漢字的理解,提供一種基于部首的書法字檢索的方法。
基于部首的書法字檢索方法包括以下步驟:
1)應用書法作品切割工具切割書法字,首先將書法作品二值化并且進行平滑降噪處理,然后運用最小包圍盒的方法對二值化后的圖片進行切割記錄書法字位置信息,最后根據書法字位置信息將書法字從原作品切割出來,建立書法字圖片庫;
2)應用標注系統(tǒng)對書法字圖片進行語義標注,利用步驟1)切割過程中產生的位置信息在書法作品中標記當前書法字,對照原作品上下文對書法字圖片進行語義標注,建立書法字信息庫,語義標注內容包括:語義、繁簡體、書體,書體包括楷書、草書、行書、篆書、隸書;
3)根據GB2312-80規(guī)范建立擁有一級漢字3755個,二級漢字3008個的漢字信息索引庫;
4)基于部首的書法字檢索,用戶首先選擇偏旁部首筆畫,然后選擇部首,書法字檢索系統(tǒng)根據所選部首查詢漢字信息索引庫,檢索所有擁有該部首的漢字,再根據檢索到的漢字查詢書法字信息庫,檢索漢字對應的書法字,并將檢索到的書法字圖片展示給用戶。
所述步驟1)為:
2.1)將輸入的書法作品轉化為灰度圖:
Gray?=?R*0.299?+?G*0.587?+?B*0.114;
其中R為紅色像素值,G為綠色像素值,B為藍色像素值,Gray為灰度值。
2.2)計算灰度圖的閾值,首先計算出圖片中所有像素的最高灰度值iMaxGrayValue和最低灰度值iMinGrayValue:
iMinGrayValue=MIN(Gray.?getColor(i,j,c)|0?<i<?Gray.getWidth(),0<j<Gray.getHeight());
iMaxGrayValue=MAX?(Gray.?getColor(i,j,c)|0?<i<?Gray.getWidth(),0<j<Gray.getHeight());
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201210123122.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:SO8塑料封裝傳感器
- 下一篇:微米顆粒體復合納米碳酸鈣的制備方法





