[發明專利]基于譜時幅度分級向量辨識環境聲音事件的方法有效

申請號：	201210242825.5	申請日：	2012-07-14
公開（公告）號：	CN102789780A	公開（公告）日：	2012-11-21
發明（設計）人：	李應	申請（專利權）人：	福州大學
主分類號：	G10L15/20	分類號：	G10L15/20;G10L15/06
代理公司：	福州元創專利商標代理有限公司 35100	代理人：	蔡學俊
地址：	350108 福建省福州市***	國省代碼：	福建;35
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	基于幅度分級向量辨識環境聲音事件方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種基于譜時幅度分級向量辨識環境聲音事件的方法，其特征在于：首先計算各種相關聲音事件的譜時幅度分級向量TSASV作為辨識原型，并將各辨識原型保存在數據庫中作為分辨待測聲音事件的模板；然后計算待測聲音事件的TSASV，并將所述待測聲音事件的TSASV與各辨識原型進行比較，與所述待測聲音事件的TSASV最接近的辨識原型對應的原型聲音事件，就是所要識別的聲音事件；

所述譜時幅度分級向量的構造方法包括以下步驟：

步驟1：對獲取的環境聲音事件進行快速傅立葉變換，生成聲譜圖；????

步驟2：對生成的聲譜圖進行不同頻率分辨的采樣，用聲譜圖構建不同頻率分辨的子聲譜圖；

步驟3：對子聲譜圖進行信號增強，生成信號增強的子聲譜圖；

步驟4：對信號增強的子聲譜圖進行幅度分級；

步驟5：對幅度分級后的子聲譜圖進行編碼，生成TSASV。

2.根據權利要求1所述的基于譜時幅度分級向量辨識環境聲音事件的方法，其特征在于：在步驟1中，對采樣的帶噪聲的環境聲音事件信號y(i)，i表示采樣次數的索引，通過窗口h(i)對N個連續的信號y(i)進行加窗，并對窗內的樣本進行快速傅立葉變換，把帶噪聲的時域信號y(i)轉換成頻域信號；把窗口下移M個采樣點，再計算下一個快速傅立葉變換，得到環境聲音事件信號y(i)的譜為：

其中，l?表示窗口滑動的索引，即時域信號幀的索引，l∈{0,1,?…?,L-1}，L表示信號y(i)分幀的總數；k表示信號頻率分辨的索引，k∈{0,1,?…?,N-1}，N表示信號頻率分辨的數量。

3.根據權利要求2所述的基于譜時幅度分級向量辨識環境聲音事件的方法，其特征在于：在步驟2中，對環境聲音事件信號y(i)的譜Y(k,?l)進行一定頻率分辨的采樣，得到子采樣譜Y^d，譜Y(k,?l)以及子采樣譜Y^d表示如下：

Y?~?[?Y¹,?Y²,?…Y^d,?…,?Y^D]

其中，D表示對頻譜Y每隔D個頻率分辨點采一個點作為頻率分辨點，即把頻譜圖Y分解成子譜Y^d的數量，d表示頻率分辨采樣子譜圖的索引，d∈(1,2,?…?,D)，Y^d表示一個(N/D)×L的矩陣，Y^d可以表示為：

Y^d(b,?l)?=Y(?k_d,?l?)

其中，b表示子譜Y^d在譜Y中進行頻率采樣的索引，b∈(0,?1,?…,?N/D-1)，N/D表示子譜Y^d的行數，N/D∈{正整數}，k_d表示頻率分辨的采樣點，k_d?=?b*D+d-1。

4.根據權利要求3所述的基于譜時幅度分級向量辨識環境聲音事件的方法，其特征在于：在步驟3中，對子采樣譜Y^d進行信號增強處理，將子采樣譜Y^d轉換成信號增強的子采樣譜X^d，信號增強的譜X(k,?l)以及子采樣譜X^d表示如下：

X?~?[X^?1,?X^?2,?…X?d,?…,?X^?D]

其中，D表示對頻譜Y每隔D個頻率分辨點采一個點作為頻率分辨點，即把頻譜圖Y分解成子譜Y^d的數量，d表示頻率分辨采樣子譜圖的索引，d∈(1,2,?…?,D)，X^?d表示一個(N/D)×L的矩陣，X^d可以表示為：

X^d(b,?l)?=?X?(?k_d,?l?)

其中，b表示子譜X^d在譜X中進行頻率采樣的索引，b∈(0,?1,?…,?N/D-1)，N/D表示子譜X^d的行數，N/D∈{正整數}，k_d表示頻率分辨的采樣點，k_d?=?b*D+d-1。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于福州大學，未經福州大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.17sss.com.cn/pat/books/201210242825.5/1.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提??；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】