[發明專利]語音信號的處理方法、裝置、設備及存儲介質在審
| 申請號: | 202010699053.2 | 申請日: | 2020-07-20 |
| 公開(公告)號: | CN111933170A | 公開(公告)日: | 2020-11-13 |
| 發明(設計)人: | 何沖 | 申請(專利權)人: | 歌爾科技有限公司 |
| 主分類號: | G10L21/0216 | 分類號: | G10L21/0216;G10L21/0208 |
| 代理公司: | 北京博雅睿泉專利代理事務所(特殊普通合伙) 11442 | 代理人: | 吳秀娥 |
| 地址: | 266104 山東省青島*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 信號 處理 方法 裝置 設備 存儲 介質 | ||
本發明公開了一種語音信號的處理方法、裝置、設備及存儲介質。其中,方法包括:獲取參考語音信號;根據參考語音信號,確定參考語音信號協方差以及參考語音信號中的后期混響語音信號的協方差;根據參考語音信號的協方差與后期混響語音信號的協方差,確定目標語音信號的協方差;對目標語音信號的協方差,執行更新操作;其中,更新操作包括:根據目標語音信號的協方差與第一預設閾值,確定目標協方差;根據目標協方差,確定目標語音信號;根據目標語音信號與第一預設閾值,更新目標語音信號的協方差;重復更新操作,直至達到收斂條件;輸出達到收斂條件時的目標語音信號。
技術領域
本發明涉及聲學技術領域,更具體地,涉及一種語音信號的處理方法、一種語音信號的處理裝置、一種電子設備以及一種計算機可讀存儲介質。
背景技術
目前,在一些相對封閉的聲學環境中使用免提電話、會議電話、助聽器等語音控制系統進行通信時,語音控制系統的麥克風采集到的語音信號往往會受到混響的影響,這導致用戶聽到的語音的清晰度、可讀懂度低。因此,如何對麥克風采集的語音信號去混響也顯得愈發重要。
在對麥克風采集的語音信號去混響時,通常采用多通道線性預測去混響算法。該算法對于期望輸出的目標語音信號的協方差的初始化具有重要要求,其屬于一個迭代循環的過程。現有的在對目標語音信號的協方差進行初始化時,是將前一次迭代過程中確定出的目標語音信號頻域模的平方作為當前迭代過程中目標語音信號的協方差的初始化值。而該方式存在收斂速度慢,以及目標語音信號失真的問題。
發明內容
本發明的一個目的是提供一種用于處理語音信號的新技術方案。
根據本發明的第一方面,提供了一種語音信號的處理方法,包括:
獲取參考語音信號,其中,所述參考語音信號為麥克風陣列中任一路麥克風采集到的語音信號;
根據所述參考語音信號,確定所述參考語音信號協方差以及所述參考語音信號中的后期混響語音信號的協方差;
根據所述參考語音信號的協方差與所述后期混響語音信號的協方差,確定目標語音信號的協方差;
對所述目標語音信號的協方差,執行更新操作;其中,所述更新操作包括:根據所述目標語音信號的協方差與第一預設閾值,確定目標協方差;根據所述目標協方差,確定所述目標語音信號;根據所述目標語音信號與所述第一預設閾值,更新所述目標語音信號的協方差;
重復所述更新操作,直至達到收斂條件;
輸出達到收斂條件時的所述目標語音信號。
可選的,所述根據所述參考語音信號,確定所述參考語音信號協方差以及所述參考語音信號中的后期混響語音信號的協方差,包括:
根據所述參考語音信號,確定所述參考語音信號的協方差;
根據所述參考語音信號的協方差,確定所述參考語音信號中的后期混響語音信號的協方差。
可選的,所述方法在所述根據所述參考語音信號,確定所述參考語音信號協方差以及所述參考語音信號中的后期混響語音信號的協方差之后,還包括:
對確定出的所述后期混響語音信號的協方差執行遞歸平均處理,以得到處理后的所述后期混響語音信號的協方差;
利用處理后的所述后期混響語音信號的協方差,更新確定出的所述后期混響語音信號的協方差。
可選的,所述根據所述目標語音信號的協方差與第一預設閾值,確定目標協方差,包括:
將所述目標語音信號的協方差與第一預設閾值中的最大值,確定為所述目標協方差。
可選的,所述收斂條件包括:
重復所述更新操作的重復次數達到預設次數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于歌爾科技有限公司,未經歌爾科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010699053.2/2.html,轉載請聲明來源鉆瓜專利網。





