[發(fā)明專利]基于脈沖神經(jīng)網(wǎng)絡的語音喚醒方法、裝置及電子設備在審
| 申請?zhí)枺?/td> | 202110581302.2 | 申請日: | 2021-05-26 |
| 公開(公告)號: | CN113160823A | 公開(公告)日: | 2021-07-23 |
| 發(fā)明(設計)人: | 肖揚;羅濤;施佳子;于海燕 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/08;G10L25/18;G10L25/24;G10L25/27;G10L25/30;G10L25/45 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 李春偉 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 脈沖 神經(jīng)網(wǎng)絡 語音 喚醒 方法 裝置 電子設備 | ||
1.一種基于脈沖神經(jīng)網(wǎng)絡的語音喚醒方法,其中,所述脈沖神經(jīng)網(wǎng)絡包括特征提取層、學習分類層以及輸出層,所述語音喚醒方法包括:
獲取語音信號,所述語音信號包括具有開始點和結束點的聲波信號;
通過所述特征提取層對所述語音信號進行特征提取,得到脈沖序列;
通過學習分類層對所述脈沖序列進行分類,得到分類結果,并通過所述輸出層輸出所述分類結果;以及
基于所述分類結果判斷是否喚醒目標設備。
2.根據(jù)權利要求1所述的語音喚醒方法,其中,所述特征提取層包括預處理層、第一特征提取層以及第二特征提取層。
3.根據(jù)權利要求2所述的語音喚醒方法,其中,所述通過所述特征提取層對所述語音信號進行特征提取,得到脈沖序列包括:
使用所述預處理層對所述語音信號進行預處理,得到時域信號;
使用所述第一特征提取層對所述時域信號進行特征提取,得到梅爾頻率信息;以及
使用所述第二特征提取層對所述梅爾頻率信息進行特征提取,得到所述脈沖序列。
4.根據(jù)權利要求3所述的語音喚醒方法,其中,所述使用所述預處理層對所述語音信號進行預處理,得到時域信號包括:
采用一階類高通濾波器對所述語音信號進行預加重處理,以提高所述語音信號中的高頻部分;以及
在所述預加重處理之后,對所述語音信號進行分幀,得到語音信號幀,使用窗函數(shù)對所述語音信號幀加窗處理,得到所述時域信號。
5.根據(jù)權利要求4所述的語音喚醒方法,其中,所述使用所述第一特征提取層對所述時域信號進行特征提取,得到梅爾頻率信息包括:
獲取所述時域信號,對所述時域信號與所述窗函數(shù)的乘積進行短時傅里葉變換,以將所述時域信號轉換為頻域信號;
將所述頻域信號在時間上進行堆疊,以生成頻譜圖,其中,所述頻譜圖包含頻率信息;以及
將至少一個梅爾濾波器組應用于所述頻譜圖中,以將所述頻譜圖中的頻率信息轉換為梅爾頻率信息。
6.根據(jù)權利要求5所述的語音喚醒方法,其中,所述使用所述第一特征提取層對所述時域信號進行特征提取,得到梅爾頻率信息還包括:
得到所述梅爾頻率信息后,計算所述至少一個梅爾濾波器組中的每一個輸出的對數(shù)能量。
7.根據(jù)權利要求5所述的語音喚醒方法,其中,所述使用所述第二特征提取層對所述梅爾頻率信息進行特征提取,得到所述脈沖序列包括:
通過時滯編碼方式對所述梅爾頻率信息進行編碼,以將所述梅爾頻率轉換為脈沖信息;以及
通過K-SVD算法獲得所述脈沖信息的字典,計算所述脈沖信息局部信息與所述字典之間的距離,通過所述距離確定最佳匹配碼本,通過所述最佳匹配碼本將所述脈沖信息轉換為所述脈沖序列。
8.根據(jù)權利要求1所述的語音喚醒方法,其中,所述基于所述分類結果判斷是否喚醒目標設備包括:
若所述分類結果與多個預設關鍵詞中的至少一個屬于同一類別,則喚醒所述目標設備;以及
若所述分類結果與多個預設關鍵詞中每一個屬于不同類別,則不喚醒所述目標設備。
9.根據(jù)權利要求1至8中任一項所述的語音喚醒方法,其中,在所述獲取語音信號之前,所述喚醒方法還包括:
采用端點檢測方法檢測接收的聲波信號,確定所述聲波信號中包含語音內容的開始點和結束點,并對非語音內容進行刪除,得到所述語音信號。
10.根據(jù)權利要求1至8中任一項所述的語音喚醒方法,其中,所述學習分類層通過Tempotron算法對所述脈沖序列進行分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經(jīng)中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202110581302.2/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡轉換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡
- 神經(jīng)網(wǎng)絡的生成方法、生成裝置和電子設備
- 一種舌診方法、裝置、計算設備及計算機存儲介質
- 學習神經(jīng)網(wǎng)絡結構
- 脈沖神經(jīng)網(wǎng)絡轉換方法及相關轉換芯片
- 圖像處理方法、裝置、可讀存儲介質和計算機設備
- 一種適應目標數(shù)據(jù)集的網(wǎng)絡模型微調方法、系統(tǒng)、終端和存儲介質
- 用于重構人工神經(jīng)網(wǎng)絡的處理器及其操作方法、電氣設備
- 一種圖像神經(jīng)網(wǎng)絡結構的優(yōu)化方法及裝置





