[發(fā)明專利]一種基于深度學習的機器翻譯系統(tǒng)的融合系統(tǒng)及方法有效
| 申請?zhí)枺?/td> | 201810722720.7 | 申請日: | 2018-07-04 |
| 公開(公告)號: | CN108920472B | 公開(公告)日: | 2020-01-10 |
| 發(fā)明(設(shè)計)人: | 楊沐昀;朱俊國;趙鐵軍;朱聰慧;曹海龍;徐冰;鄭德權(quán) | 申請(專利權(quán))人: | 哈爾濱工業(yè)大學 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06K9/62;G06N3/08 |
| 代理公司: | 23211 哈爾濱市陽光惠遠知識產(chǎn)權(quán)代理有限公司 | 代理人: | 安琪 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍;23 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 融合系統(tǒng) 機器翻譯系統(tǒng) 編碼步驟 編碼模塊 解碼步驟 解碼模塊 融合性能 輸出步驟 輸出模塊 輸入步驟 輸入模塊 融合 詞匯 學習 | ||
本發(fā)明涉及一種基于深度學習的機器翻譯系統(tǒng)的融合系統(tǒng)及方法,屬于詞匯融合技術(shù)領(lǐng)域。所述融合系統(tǒng)包括輸入模塊、編碼模塊、解碼模塊和輸出模塊;所述融合方法包括輸入步驟、編碼步驟、解碼步驟和輸出步驟;所述融合系統(tǒng)及方法具有提高機器翻譯系統(tǒng)融合性能指標的特點。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于深度學習的機器翻譯系統(tǒng)的融合系統(tǒng)及方法,屬于詞匯融合技術(shù)領(lǐng)域。
背景技術(shù)
機器翻譯系統(tǒng)融合是將不同的機器翻譯系統(tǒng)的譯文從新組合生成一個質(zhì)量更高譯文的一類方法。其中的詞匯級系統(tǒng)融合是現(xiàn)今最為流行的方法且性能非常好。為了進一步提升系統(tǒng)融合性能,深度神經(jīng)網(wǎng)絡(luò)模型被引入到機器翻譯譯文融合研究中。然而神經(jīng)網(wǎng)絡(luò)模型通常需要大量的數(shù)據(jù)進行訓練,才能在性能上超過經(jīng)典的融合模型。在實際機器翻譯譯文融合的任務(wù)中,受訓練數(shù)據(jù)規(guī)模影響,直接使用小規(guī)模數(shù)據(jù)訓練通常并不能獲得理想的性能,無法滿足用戶實時翻譯需求。
發(fā)明內(nèi)容
本發(fā)明為了解決現(xiàn)有詞匯系統(tǒng)融合技術(shù)中詞匯融合性能不好,無法滿足用于實時翻譯需求的問題,提出了一種基于深度學習的機器翻譯系統(tǒng)的融合系統(tǒng)及方法。
一種基于深度學習的機器翻譯系統(tǒng)的融合系統(tǒng),所采取的技術(shù)方案如下:
所述機器翻譯系統(tǒng)的融合系統(tǒng)包括:
用于輸入1個源語言句子和所述源語言句子的n個機器翻譯譯文的輸入模塊,其中,n為大于2的整數(shù);
用于將所述源語言句子和n個機器翻譯譯文編碼成向量的編碼模塊;
用于將所述編碼模塊輸出的向量進行融合重新解碼成句子的融合解碼模塊,其中,所述融合重新解碼成的句子即為融合后譯文;
用于對所述融合解碼模塊進行參數(shù)學習的模型參數(shù)訓練模塊;所述模型訓練模塊包括在原編碼-解碼模型基礎(chǔ)上構(gòu)建一個從源語言到目標語言的翻譯模型的模型建立模塊;
用于輸出所述融合后譯文的輸出模塊。
進一步地,所述編碼模塊包括:
用于采用雙向循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)將所述源語言句子編碼成一個向量的序列的源語言句子編碼子模塊;
用于通過引入所述機器翻譯譯文所對應(yīng)的源語言句子的注意力機制模塊對所述機器翻譯譯文進行編碼的機器翻譯文編碼子模塊;
所述機器翻譯文編碼子模塊中包括:
用于輸入機器譯文句子和源語言向量序列的輸入模塊;、
用于輸出機器譯文的向量序列的輸出模塊;
用于利用條件門循環(huán)網(wǎng)絡(luò)單元(cGRU:Conditional Gated Recurrent Unit)計算所述向量序列中每個向量的向量計算模塊。注意力機制(attention mechanism)在機器翻譯中的本質(zhì)是權(quán)重的分配建立起源語言和目標語言之間的詞對齊關(guān)系。。
其中,所述源語言句子的注意力機制模塊包括:
源語言句子的編碼輸入模塊(hi);
源語言句子的編碼的權(quán)重計算模塊(計算各個αi,j);
注意力向量生成模塊(cj);
進一步地,所述雙向循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)采用GRU(Gated Recurrent Unit)結(jié)構(gòu)。
進一步地,所述融合解碼模塊包括一個多注意力的cGRUmutil-att(ConditionalGated Recurrent Unit with multi-attention)單元,其中,
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工業(yè)大學,未經(jīng)哈爾濱工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201810722720.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種多個機器翻譯系統(tǒng)融合的方法及裝置
- 一種統(tǒng)計機器翻譯中的翻譯方法和裝置
- 提高神經(jīng)機器翻譯準確度的方法、翻譯方法及系統(tǒng)和設(shè)備
- 一種機器翻譯控制系統(tǒng)及方法、信息數(shù)據(jù)處理終端
- 機器翻譯引擎推薦方法及裝置
- 一種基于篇章的機器翻譯引擎測評優(yōu)選方法及系統(tǒng)
- 一種機器翻譯引擎測評優(yōu)選方法及系統(tǒng)
- 一種基于字節(jié)對編碼技術(shù)的蒙漢機器翻譯系統(tǒng)
- 基于混合策略的移動設(shè)備機器翻譯系統(tǒng)
- 混合深度學習網(wǎng)絡(luò)與單詞生成統(tǒng)計學指導的機器翻譯方法
- 代碼轉(zhuǎn)換方法和具有嵌入式濾波器的代碼轉(zhuǎn)換裝置
- 可變長度編碼方法,可變長度譯碼方法,存儲介質(zhì),可變長度編碼設(shè)備,可變長度譯碼設(shè)備,和位流
- 可變長度譯碼方法,可變長度譯碼設(shè)備
- 用于以至少兩個編碼步驟和至少一個置換步驟來編碼數(shù)據(jù)的方法、對應(yīng)的編碼裝置、計算機程序和信號
- 跨數(shù)據(jù)庫支持多字段組合的自動編碼方法和系統(tǒng)
- 一種生成商品編碼的方法及系統(tǒng)
- 一種基于RGB源視頻的率失真優(yōu)化編碼方法
- AVS2視頻編碼方法、裝置及電子設(shè)備
- 背景幀生成及更新方法、系統(tǒng)、裝置及介質(zhì)
- 動態(tài)調(diào)整圖像編碼區(qū)域的方法





