[發明專利]語音情緒識別方法、系統、移動終端及存儲介質在審
| 申請號: | 202011119128.1 | 申請日: | 2020-10-19 |
| 公開(公告)號: | CN112489625A | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 陳劍超;肖龍源;葉志堅 | 申請(專利權)人: | 廈門快商通科技股份有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/05;G10L15/06;G10L25/12;G10L25/27;G10L25/63 |
| 代理公司: | 廈門仕誠聯合知識產權代理事務所(普通合伙) 35227 | 代理人: | 樂珠秀 |
| 地址: | 361009 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 情緒 識別 方法 系統 移動 終端 存儲 介質 | ||
1.一種語音情緒識別方法,其特征在于,所述方法包括:
獲取語音樣本數據,并對所述語音樣本數據中的語音樣本進行語音預處理;
獲取語音預處理后所述語音樣本的樣本熵特征,并根據所述樣本熵特征進行端點檢測;
根據端點檢測結果對所述語音樣本進行語音過濾,并提取語音過濾后所述語音樣本的語音特征;
將所述語音特征與所述樣本熵特征進行特征融合,得到語音融合特征,并對所述語音融合特征進行特征降維,得到語音情緒特征;
根據所述語音情緒特征對語音情緒識別模型進行模型訓練,直至所述語音情緒識別模型收斂;
將待識別語音輸入收斂后的所述語音情緒識別模型進行語音情緒識別,得到語音情緒識別結果。
2.如權利要求1所述的語音情緒識別方法,其特征在于,所述根據所述樣本熵特征進行端點檢測的步驟包括:
若所述樣本熵特征大于第一門限閾值,則判定所述樣本熵特征對應的語音節點為語音起始點;
若所述樣本熵特征小于第二門限閾值,則判定所述樣本熵特征對應的語音節點為語音噪聲;
若所述樣本熵特征大于所述第二門限閾值且小于所述第一門限閾值,則獲取所述樣本語音的短時過零率;
若所述短時過零率小于第三門限閾值,則判定所述短時過零率對應的語音節點為語音起止點。
3.如權利要求1所述的語音情緒識別方法,其特征在于,所述將所述語音特征與所述樣本熵特征進行特征融合的步驟包括:
對所述語音特征和所述樣本熵特征進行向量轉換,得到語音特征向量和樣本熵特征向量;
計算所述語音特征向量和所述樣本熵特征向量之間的矢量和,得到所述語音融合特征。
4.如權利要求1所述的語音情緒識別方法,其特征在于,所述對所述語音融合特征進行特征降維的步驟包括:
對所述語音融合特征進行數據標準化處理,并計算數據標準化處理后所述語音融合特征的協方差矩陣;
對所述協方差矩陣進行特征值分解,得到特征向量,并根據所述特征向量構建特征序列;
對所述特征序列進行降維映射,得到所述語音情緒特征。
5.如權利要求4所述的語音情緒識別方法,其特征在于,所述對所述語音融合特征進行數據標準化處理的步驟包括:
計算所述語音融合特征的特征均值和特征標準差,并計算所述語音融合特征與所述特征均值之間的特征差值;
計算所述特征差值與所述特征標準差之間的商值,得到所述數據標準化處理后所述語音融合特征。
6.如權利要求1所述的語音情緒識別方法,其特征在于,所述根據所述語音情緒特征對語音情緒識別模型進行模型訓練的步驟包括:
根據所述語音情緒特征計算所述語音情緒識別模型中神經元的輸入和輸出,并根據所述神經元的輸入和輸出計算輸出誤差;
根據所述輸出誤差調節所述語音情緒識別模型中所述神經元的連接權值和閾值;
若所述神經元之間所述輸出誤差的平均值小于預設值,且所述語音情緒識別模型的迭代次數大于次數閾值,則判定所述語音情緒識別模型收斂。
7.如權利要求1所述的語音情緒識別方法,其特征在于,所述對所述語音樣本數據中的語音樣本進行語音預處理的步驟包括:
將所述語音樣本輸入反混疊濾波器進行語音濾波,并對語音濾波后的所述語音樣本進行采樣和量化;
對采樣和量化后的所述樣本語音進行預加重處理,并對預加重處理后的所述所述樣本語音進行加窗和分幀處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門快商通科技股份有限公司,未經廈門快商通科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202011119128.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:汽車輪轂柔性加工夾具
- 下一篇:一種熔池爐熔煉系統及方法





