[發(fā)明專利]一種機器翻譯方法、裝置、電子設(shè)備和介質(zhì)在審
| 申請?zhí)枺?/td> | 201811542438.7 | 申請日: | 2018-12-17 |
| 公開(公告)號: | CN109697292A | 公開(公告)日: | 2019-04-30 |
| 發(fā)明(設(shè)計)人: | 張睿卿;何中軍;吳華;王海峰 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F16/35 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 源語言句 機器翻譯 粗分類 翻譯 目標(biāo)語言翻譯 分類 電子設(shè)備 細(xì)分類 類別分類 手動選擇 自動識別 維度 清晰 | ||
本發(fā)明實施例公開了一種機器翻譯方法、裝置、電子設(shè)備和介質(zhì),該方法包括:獲取待翻譯的源語言句;利用預(yù)先訓(xùn)練的機器翻譯模型,同時給出所述源語言句的目標(biāo)語言翻譯結(jié)果,以及所述源語言句所屬的類別,其中,所述類別包括粗分類和粗分類下所屬的細(xì)分類,所述機器翻譯模型用于結(jié)合對源語言句的分類任務(wù)給出目標(biāo)語言翻譯結(jié)果。本發(fā)明實施例免去用戶手動選擇領(lǐng)域的麻煩,同時執(zhí)行分類任務(wù)和翻譯任務(wù),并且在分類任務(wù)中給出粗分類和粗分類下所屬的細(xì)分類,而不是在同一個維度上對各領(lǐng)域進(jìn)行分類,使得模型在類別分類階段更有針對性,不僅能夠自動識別源語言句所述的類別和領(lǐng)域,同時使得各領(lǐng)域所負(fù)責(zé)的翻譯內(nèi)容界限更為清晰,提升翻譯效果。
技術(shù)領(lǐng)域
本發(fā)明實施例涉及機器翻譯技術(shù)領(lǐng)域,尤其涉及一種機器翻譯方法、裝置、電子設(shè)備和介質(zhì)。
背景技術(shù)
隨著計算機計算能力的提升和多語言信息的爆發(fā)式增長,機器翻譯在如今的翻譯領(lǐng)域扮演著重要角色,有著高速、低成本的優(yōu)勢,可以為普通用戶提供實時便捷的翻譯服務(wù)。
機器翻譯中,對于專業(yè)領(lǐng)域的文本,分領(lǐng)域地訓(xùn)練翻譯模型可以大幅提高對應(yīng)領(lǐng)域的翻譯效果。當(dāng)前有部分互聯(lián)網(wǎng)翻譯系統(tǒng),通過引入領(lǐng)域信息,針對每個領(lǐng)域進(jìn)行數(shù)據(jù)和模型上的優(yōu)化,達(dá)到了翻譯效果的提升。但是這些領(lǐng)域的分類比較隨意,沒有系統(tǒng)性,在同一個維度上劃分各領(lǐng)域,造成領(lǐng)域混淆,影響翻譯效果。而且在具體實現(xiàn)的過程中,通常需要用戶先手動選擇一個目標(biāo)領(lǐng)域,再由相應(yīng)模型針對性的給出翻譯文本,操作繁瑣,影響翻譯效率。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種機器翻譯方法、裝置、電子設(shè)備和介質(zhì),以解決現(xiàn)有技術(shù)中自動翻譯準(zhǔn)確率低以及效率低的問題。
第一方面,本發(fā)明實施例提供了一種機器翻譯方法,所述方法包括:
獲取待翻譯的源語言句;
利用預(yù)先訓(xùn)練的機器翻譯模型,同時給出所述源語言句的目標(biāo)語言翻譯結(jié)果,以及所述源語言句所屬的類別,其中,所述類別包括粗分類和粗分類下所屬的細(xì)分類,所述機器翻譯模型用于結(jié)合對源語言句的分類任務(wù)給出目標(biāo)語言翻譯結(jié)果。
第二方面,本發(fā)明實施例還提供了一種機器翻譯裝置,所述裝置包括:
源語言句獲取模塊,用于獲取待翻譯的源語言句;
源語言句翻譯模塊,用于利用預(yù)先訓(xùn)練的機器翻譯模型,同時給出所述源語言句的目標(biāo)語言翻譯結(jié)果,以及所述源語言句所屬的類別,其中,所述類別包括粗分類和粗分類下所屬的細(xì)分類,所述機器翻譯模型用于結(jié)合對源語言句的分類任務(wù)給出目標(biāo)語言翻譯結(jié)果。
第三方面,本發(fā)明實施例還提供了一種電子設(shè)備,所述電子設(shè)備包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序,
當(dāng)所述一個或多個程序被所述一個或多個處理器執(zhí)行,使得所述一個或多個處理器實現(xiàn)如本發(fā)明任意實施例所述的一種機器翻譯方法。
第四方面,本發(fā)明實施例還提供了一種包含計算機可執(zhí)行指令的存儲介質(zhì),所述計算機可執(zhí)行指令在由計算機處理器執(zhí)行時用于執(zhí)行如本發(fā)明任意實施例所述的一種機器翻譯方法。
本發(fā)明實施例通過獲取待翻譯的源語言句;利用預(yù)先訓(xùn)練的機器翻譯模型,同時給出所述源語言句的目標(biāo)語言翻譯結(jié)果,以及所述源語言句所屬的類別,其中,所述類別包括粗分類和粗分類下所屬的細(xì)分類,所述機器翻譯模型用于結(jié)合對源語言句的分類任務(wù)給出目標(biāo)語言翻譯結(jié)果,一方面免去用戶手動選擇領(lǐng)域的麻煩,另一方面,可以同時執(zhí)行分類任務(wù)和翻譯任務(wù),并且在分類任務(wù)中給出粗分類和粗分類下所屬的細(xì)分類,而不是在同一個維度上對各領(lǐng)域進(jìn)行分類,使得模型在類別分類階段更有針對性,不僅能夠自動識別源語言句所述的類別和領(lǐng)域,同時使得各領(lǐng)域所負(fù)責(zé)的翻譯內(nèi)容界限更為清晰,提升翻譯效果。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201811542438.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:文本的語義段落識別方法和裝置
- 下一篇:含有可編程計算單元的可編程門陣列





