[發(fā)明專利]一種古漢語(yǔ)語(yǔ)義分析方法及其系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201710509228.7 | 申請(qǐng)日: | 2017-06-28 |
| 公開(公告)號(hào): | CN107451114A | 公開(公告)日: | 2017-12-08 |
| 發(fā)明(設(shè)計(jì))人: | 熊衛(wèi) | 申請(qǐng)(專利權(quán))人: | 廣州尚恩科技股份有限公司 |
| 主分類號(hào): | G06F17/27 | 分類號(hào): | G06F17/27 |
| 代理公司: | 廣州市越秀區(qū)哲力專利商標(biāo)事務(wù)所(普通合伙)44288 | 代理人: | 徐朝榮,馬簪 |
| 地址: | 510630 廣東省廣州市*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 古漢語(yǔ) 語(yǔ)義 分析 方法 及其 系統(tǒng) | ||
1.一種古漢語(yǔ)語(yǔ)義分析方法,其特征在于,包括以下步驟:
獲取古漢語(yǔ)語(yǔ)句,用戶端上傳待分析的古漢語(yǔ)信息,獲取以完整句為最小輸入單元的古漢語(yǔ)語(yǔ)句;
詞元?jiǎng)澐?,獲取古漢語(yǔ)語(yǔ)句中詞元,所述的詞元為最小的語(yǔ)義單元,將所述古漢語(yǔ)語(yǔ)句中的詞元順序存儲(chǔ)于詞元棧中;
詞元翻譯,獲取所述的詞元棧,檢索查找古漢語(yǔ)詞典庫(kù)中的詞元釋義,建立所述詞元的釋義關(guān)系映射;
語(yǔ)義拼接,獲取所述詞元的釋義關(guān)系映射,排列組合各所述詞元的的釋義,得到古漢語(yǔ)初始語(yǔ)義;
語(yǔ)義檢查,獲取所述古漢語(yǔ)初始語(yǔ)義,匹配現(xiàn)代漢語(yǔ)語(yǔ)義模板,匹配成功則將古漢語(yǔ)初始語(yǔ)義存儲(chǔ)至輸出緩存區(qū)得到待輸出語(yǔ)義;匹配不成功則返回語(yǔ)義拼接;
語(yǔ)義輸出,輸出待輸出語(yǔ)義。
2.如權(quán)利要求1所述的一種古漢語(yǔ)語(yǔ)義分析方法,其特征在于:所述的古漢語(yǔ)語(yǔ)義分析方法還包括朝代匹配,所述的朝代匹配位于詞元翻譯與語(yǔ)義拼接之間;所述的詞元釋義中包括詞元朝代信息;
所述的朝代匹配具體為獲取所述詞元棧中詞元朝代信息,統(tǒng)計(jì)得到詞元棧中頻率最高的詞元朝代,并對(duì)所述詞元的釋義關(guān)系映射按照詞元朝代信息排序,高頻率的詞元朝代的詞元釋義位于低頻率的詞元朝代的詞元釋義之前。
3.如權(quán)利要求2所述的一種古漢語(yǔ)語(yǔ)義分析方法,其特征在于:所述的古漢語(yǔ)語(yǔ)義分析方法還包括句式匹配,所述的句式匹配位于朝代匹配與語(yǔ)義拼接之間;
所述的句式匹配具體為根據(jù)朝代建立句式庫(kù),獲取所述的頻率最高的詞元朝代,得到所述的頻率最高的詞元朝代的語(yǔ)義句式,所述語(yǔ)義句式為所述詞元的關(guān)系鏈表,根據(jù)所述的語(yǔ)義句式對(duì)所述的詞元棧中的詞元進(jìn)行重新排序。
4.如權(quán)利要求1所述的一種古漢語(yǔ)語(yǔ)義分析方法,其特征在于:所述的古漢語(yǔ)詞典庫(kù)包括詞元典故,所述的語(yǔ)義檢查還包括詞元典故檢查,匹配現(xiàn)代漢語(yǔ)語(yǔ)義模板后,對(duì)所述的古漢語(yǔ)初始語(yǔ)義與所述的詞元典故進(jìn)行匹配,匹配成功則將古漢語(yǔ)初始語(yǔ)義存儲(chǔ)至輸出緩存區(qū)得到待輸出語(yǔ)義;匹配不成功則返回語(yǔ)義拼接。
5.如權(quán)利要求3所述的一種古漢語(yǔ)語(yǔ)義分析方法,其特征在于:所述的古漢語(yǔ)語(yǔ)義分析方法還包括語(yǔ)義自學(xué)習(xí),所述的語(yǔ)義自學(xué)習(xí)統(tǒng)計(jì)并記錄所述的詞元釋義的頻率、詞元朝代頻率、句式頻率,根據(jù)所述的釋義的頻率、詞元朝代頻率、句式頻率排序下一所述的古漢語(yǔ)語(yǔ)句中相同詞元的詞元釋義、詞元朝代、句式。
6.一種古漢語(yǔ)語(yǔ)義分析系統(tǒng),其特征在于:包括配置庫(kù)、分析模塊;所述的配置庫(kù)包括古漢語(yǔ)詞典庫(kù);所述的古漢語(yǔ)詞典庫(kù)包括詞元釋義;所述的分析模塊包括劃分模塊、翻譯模塊、拼接模塊、檢查模塊、輸出模塊;所述的劃分模塊用于將古漢語(yǔ)語(yǔ)句劃分為若干詞元;所述的翻譯模塊用于獲取所述的古漢語(yǔ)詞典庫(kù)中的詞元釋義;所述的拼接模塊用于將若干所述的詞元釋義拼接成古漢語(yǔ)初始語(yǔ)義;所述的檢查模塊用于將所述的古漢語(yǔ)初始語(yǔ)義與現(xiàn)代漢語(yǔ)語(yǔ)義模板進(jìn)行匹配檢查,匹配成功則將所述的古漢語(yǔ)初始語(yǔ)義傳輸至所述的輸出模塊輸出;匹配不成功則丟棄所述的古漢語(yǔ)初始語(yǔ)義,所述的拼接模塊重新拼接。
7.如權(quán)利要求6所述的一種古漢語(yǔ)語(yǔ)義分析系統(tǒng),其特征在于:所述的配置庫(kù)還包括朝代庫(kù);所述的朝代庫(kù)內(nèi)存儲(chǔ)的朝代信息關(guān)聯(lián)所述的古漢語(yǔ)詞典庫(kù)內(nèi)的詞元釋義;所述的古漢語(yǔ)詞典庫(kù)還包括詞元典故,所述的詞元典故內(nèi)存儲(chǔ)有詞元的典故信息;所述的檢查模塊對(duì)所述的古漢語(yǔ)初始語(yǔ)義與所述的詞元典故進(jìn)行匹配,匹配成功則將古漢語(yǔ)初始語(yǔ)義存儲(chǔ)至所述的輸出模塊的輸出緩存區(qū)得到待輸出語(yǔ)義;匹配不成功則返回至所述的拼接模塊進(jìn)行語(yǔ)義拼接。
8.如權(quán)利要求7所述的一種古漢語(yǔ)語(yǔ)義分析系統(tǒng),其特征在于:所述的配置庫(kù)還包括句式庫(kù),所述的句式庫(kù)包括朝代句式庫(kù)與現(xiàn)代句式庫(kù);所述的朝代句式庫(kù)內(nèi)存儲(chǔ)的句式信息關(guān)聯(lián)所述的朝代庫(kù)內(nèi)存儲(chǔ)的朝代信息;所述的現(xiàn)代句式庫(kù)用于存儲(chǔ)所述的現(xiàn)代漢語(yǔ)語(yǔ)義模板。
9.如權(quán)利要求8所述的一種古漢語(yǔ)語(yǔ)義分析系統(tǒng),其特征在于:所述的分析模塊還包括匹配模塊;所述的匹配模塊包括朝代匹配模塊與句式匹配模塊;所述的朝代匹配模塊用于獲取詞元的朝代信息,統(tǒng)計(jì)得到頻率最高的詞元朝代,并對(duì)詞元的釋義關(guān)系映射按照詞元朝代信息排序;所述的句式匹配模塊用于根據(jù)朝代句式庫(kù),獲取所述的頻率最高的詞元朝代,得到所述的頻率最高的詞元朝代的語(yǔ)義句式,根據(jù)所述的語(yǔ)義句式對(duì)詞元進(jìn)行排序。
10.如權(quán)利要求9所述的一種古漢語(yǔ)語(yǔ)義分析系統(tǒng),其特征在于:所述的分析模塊還包括自學(xué)習(xí)模塊;所述的自學(xué)習(xí)模塊用于統(tǒng)計(jì)并記錄詞元釋義的頻率、詞元朝代頻率、句式頻率,根據(jù)所述的詞元釋義的頻率、詞元朝代頻率、句式頻率排序下一古漢語(yǔ)語(yǔ)句中相同詞元的詞元釋義、詞元朝代、句式。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州尚恩科技股份有限公司,未經(jīng)廣州尚恩科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201710509228.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種漢語(yǔ)言教師用折疊文件夾
- 一種古漢語(yǔ)語(yǔ)義分析方法及其系統(tǒng)
- 一種基于貝葉斯統(tǒng)計(jì)學(xué)習(xí)的醫(yī)學(xué)古漢語(yǔ)句子切分方法
- 一種基于神經(jīng)機(jī)器翻譯的古漢語(yǔ)翻譯方法
- 一種古漢語(yǔ)自動(dòng)分詞及詞性標(biāo)注一體化方法及裝置
- 對(duì)古漢語(yǔ)進(jìn)行斷句的方法、裝置以及存儲(chǔ)介質(zhì)
- 展臺(tái)(古漢語(yǔ)文學(xué)書籍)
- 一種漢語(yǔ)古籍的主題分析方法
- 一種生成古漢語(yǔ)標(biāo)注模型的方法和系統(tǒng)
- 一種古漢語(yǔ)學(xué)習(xí)盒
- 面向語(yǔ)義Web服務(wù)程序設(shè)計(jì)的語(yǔ)義數(shù)據(jù)表示和處理方法
- 一種基于語(yǔ)義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語(yǔ)義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語(yǔ)義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語(yǔ)義匹配方法和系統(tǒng)
- 遠(yuǎn)程語(yǔ)義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語(yǔ)義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語(yǔ)義表征和語(yǔ)義計(jì)算的信號(hào)語(yǔ)義識(shí)別方法
- 語(yǔ)義分類方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





