[發明專利]一種語音處理方法、裝置、設備及存儲介質在審

申請號：	202010417021.9	申請日：	2020-05-15
公開（公告）號：	CN111554323A	公開（公告）日：	2020-08-18
發明（設計）人：	肖瑋	申請（專利權）人：	騰訊科技（深圳）有限公司
主分類號：	G10L25/30	分類號：	G10L25/30;G10L21/003;G10L21/02
代理公司：	廣州三環專利商標代理有限公司 44202	代理人：	熊永強;杜維
地址：	518057 廣東省深圳***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種語音處理方法裝置設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請實施例提供一種語音處理方法、裝置、設備及存儲介質，其中的方法可包括：確定待處理的目標語音幀對應的歷史語音幀；獲取歷史語音幀的頻域特征和歷史語音幀的時域參數；提取歷史語音幀的時域參數的統計特征；調用網絡模型對歷史語音幀的頻域特征、歷史語音幀的時域參數及歷史語音幀的時域參數的統計特征進行預測處理，得到目標語音幀的參數集，參數集中包含至少兩個參數；根據參數集重建目標語音幀。本申請實施例能夠彌補傳統信號分析處理技術的不足，提升語音處理能力。

技術領域

本申請涉及互聯網技術領域，具體涉及VoIP(Voice over Internet Protocol，基于IP的語音傳輸)通話技術領域，尤其一種語音處理方法，一種語音處理裝置、一種語音處理設備及一種計算機可讀存儲介質。

背景技術

語音信號經VoIP系統傳輸的過程中可能會產生音質損傷的現象。現有技術中，解決音質損傷的現象的一種主流方案是經典的PLC技術，主要原理是：接收端如果未收到第n(n為正整數)幀語音幀，會對第n-1幀語音幀進行信號分析處理以補償第n幀語音幀。但實踐發現，由于信號分析處理能力有限，經典的PLC技術的語音處理能力有限，無法適用于現網突發丟包的場景。

發明內容

本申請實施例提供一種語音處理方法、裝置、設備及存儲介質，能夠彌補傳統信號分析處理技術的不足，提升語音處理能力。

一方面，本申請實施例提供一種語音處理方法，包括：

確定待處理的目標語音幀對應的歷史語音幀；

獲取歷史語音幀的頻域特征和歷史語音幀的時域參數；

提取歷史語音幀的時域參數的統計特征；

調用網絡模型對歷史語音幀的頻域特征、歷史語音幀的時域參數及歷史語音幀的時域參數的統計特征進行預測處理，得到目標語音幀的參數集，參數集中包含至少兩個參數；

根據參數集重建目標語音幀。

一方面，本申請實施例提供另一種語音處理方法，包括：

接收經VoIP系統傳輸的語音信號；

當語音信號中的目標語音幀丟失時，采用如上述的方法重建目標語音幀；

基于重建的目標語音幀輸出語音信號。