[發明專利]語音合成方法和裝置有效
| 申請號: | 201510417099.X | 申請日: | 2015-07-15 |
| 公開(公告)號: | CN104992704B | 公開(公告)日: | 2017-06-20 |
| 發明(設計)人: | 謝延;李秀林;白潔 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G10L13/04 | 分類號: | G10L13/04;G10L13/02 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙)11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 合成 方法 裝置 | ||
技術領域
本發明涉及語音處理技術領域,尤其涉及一種語音合成方法和裝置。
背景技術
語音合成技術根據服務的提供方式可劃分為基于云端引擎的語音合成(以下簡稱:“在線語音合成”)和基于本地引擎的語音合成(以下簡稱:“離線語音合成”)兩種,這兩種語音合成技術具有各自的優點和缺點。在線語音合成具有高自然度、高實時性和不占用客戶端設備資源等優點,但是其缺點也非常明顯,由于使用語音合成的應用(Application;以下簡稱:App)可以一次性發送大段文本到服務器端,但是服務器端合成的語音數據是分段發回給安裝上述App的客戶端的,而語音的數據量即使經過壓縮也相對較大(例如:4kb/s),如果網絡環境的不穩定性,在線語音合成將變得非常緩慢而無法實現連貫的合成;離線語音合成則可以脫離對網絡的依賴,能夠保證合成服務的穩定性,但是合成的效果相比在線合成較差。
綜上所述,現有技術中使用到語音合成技術的產品都是基于單獨的在線語音合成或者單獨的離線語音合成,在線語音合成對數據流量消耗較大,遇到網絡錯誤只能提示用戶發生錯誤,而離線語音合成的效果不是特別自然,用戶體驗較差。
發明內容
本發明的目的旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本發明的第一個目的在于提出一種語音合成方法。該方法結合在線語音合成與離線語音合成的優點,可以提供更穩定、效果更自然的語音合成服務,保證了用戶的語音合成請求總是可以順利地完成,提高了用戶對語音合成服務的認可度和用戶體驗度。
本發明的第二個目的在于提出一種語音合成裝置。
為了實現上述目的,本發明第一方面實施例的語音合成方法,包括:對文本進行處理,獲得待合成文本;當存在網絡連接時,將所述待合成文本發送給在線語音合成系統進行語音合成;如果在所述在線語音合成系統進行語音合成的過程中,所述在線語音合成系統出現故障或者實際使用過程中網絡連接中斷,則將所述在線語音合成系統未完成語音合成的文本發送給離線語音合成系統進行語音合成。
本發明實施例的語音合成方法中,當存在網絡連接時,將上述待合成文本發送給在線語音合成系統進行語音合成,如果在上述在線語音合成系統進行語音合成的過程中,在線語音合成系統出現故障或者實際使用過程中網絡連接中斷,則將在線語音合成系統未完成語音合成的文本發送給離線語音合成系統進行語音合成,從而可以結合在線語音合成與離線語音合成的優點,提供更穩定、效果更自然的語音合成服務,保證了用戶的語音合成請求總是可以順利地完成,提高了用戶對語音合成服務的認可度和用戶體驗度。
為了實現上述目的,本發明第二方面實施例的語音合成裝置,包括:文本處理模塊,用于對文本進行處理,獲得待合成文本;發送模塊,用于在存在網絡連接時,將所述文本處理模塊獲得的待合成文本發送給在線語音合成系統進行語音合成;如果在所述在線語音合成系統進行語音合成的過程中,所述在線語音合成系統出現故障或者實際使用過程中網絡連接中斷,則將所述在線語音合成系統未完成語音合成的文本發送給離線語音合成系統進行語音合成。
本發明實施例的語音合成裝置中,當存在網絡連接時,發送模塊將上述待合成文本發送給在線語音合成系統進行語音合成,如果在上述在線語音合成系統進行語音合成的過程中,在線語音合成系統出現故障或者實際使用過程中網絡連接中斷,則將在線語音合成系統未完成語音合成的文本發送給離線語音合成系統進行語音合成,從而可以結合在線語音合成與離線語音合成的優點,提供更穩定、效果更自然的語音合成服務,保證了用戶的語音合成請求總是可以順利地完成,提高了用戶對語音合成服務的認可度和用戶體驗度。
本發明附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發明的實踐了解到。
附圖說明
本發明上述的和/或附加的方面和優點從下面結合附圖對實施例的描述中將變得明顯和容易理解,其中:
圖1為本發明語音合成方法一個實施例的流程圖;
圖2為本發明語音合成方法另一個實施例的流程圖;
圖3為本發明語音合成方法再一個實施例的流程圖;
圖4為本發明語音合成方法再一個實施例的流程圖;
圖5為本發明語音合成裝置一個實施例的結構示意圖;
圖6為本發明語音合成裝置另一個實施例的結構示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201510417099.X/2.html,轉載請聲明來源鉆瓜專利網。





