[發明專利]基于譜時幅度分級向量辨識環境聲音事件的方法有效
| 申請號: | 201210242825.5 | 申請日: | 2012-07-14 |
| 公開(公告)號: | CN102789780A | 公開(公告)日: | 2012-11-21 |
| 發明(設計)人: | 李應 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L15/06 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 幅度 分級 向量 辨識 環境 聲音 事件 方法 | ||
1.一種基于譜時幅度分級向量辨識環境聲音事件的方法,其特征在于:首先計算各種相關聲音事件的譜時幅度分級向量TSASV作為辨識原型,并將各辨識原型保存在數據庫中作為分辨待測聲音事件的模板;然后計算待測聲音事件的TSASV,并將所述待測聲音事件的TSASV與各辨識原型進行比較,與所述待測聲音事件的TSASV最接近的辨識原型對應的原型聲音事件,就是所要識別的聲音事件;
所述譜時幅度分級向量的構造方法包括以下步驟:
步驟1:對獲取的環境聲音事件進行快速傅立葉變換,生成聲譜圖;????
步驟2:對生成的聲譜圖進行不同頻率分辨的采樣,用聲譜圖構建不同頻率分辨的子聲譜圖;
步驟3:對子聲譜圖進行信號增強,生成信號增強的子聲譜圖;
步驟4:對信號增強的子聲譜圖進行幅度分級;
步驟5:對幅度分級后的子聲譜圖進行編碼,生成TSASV。
2.根據權利要求1所述的基于譜時幅度分級向量辨識環境聲音事件的方法,其特征在于:在步驟1中,對采樣的帶噪聲的環境聲音事件信號y(i),i表示采樣次數的索引,通過窗口h(i)對N個連續的信號y(i)進行加窗,并對窗內的樣本進行快速傅立葉變換,把帶噪聲的時域信號y(i)轉換成頻域信號;把窗口下移M個采樣點,再計算下一個快速傅立葉變換,得到環境聲音事件信號y(i)的譜為:
其中,l?表示窗口滑動的索引,即時域信號幀的索引,l∈{0,1,?…?,L-1},L表示信號y(i)分幀的總數;k表示信號頻率分辨的索引,k∈{0,1,?…?,N-1},N表示信號頻率分辨的數量。
3.根據權利要求2所述的基于譜時幅度分級向量辨識環境聲音事件的方法,其特征在于:在步驟2中,對環境聲音事件信號y(i)的譜Y(k,?l)進行一定頻率分辨的采樣,得到子采樣譜Yd,譜Y(k,?l)以及子采樣譜Yd表示如下:
Y?~?[?Y1,?Y2,?…Yd,?…,?YD]
其中,D表示對頻譜Y每隔D個頻率分辨點采一個點作為頻率分辨點,即把頻譜圖Y分解成子譜Yd的數量,d表示頻率分辨采樣子譜圖的索引,d∈(1,2,?…?,D),Yd表示一個(N/D)×L的矩陣,Yd可以表示為:
Yd(b,?l)?=Y(?kd,?l?)
其中,b表示子譜Yd在譜Y中進行頻率采樣的索引,b∈(0,?1,?…,?N/D-1),N/D表示子譜Yd的行數,N/D∈{正整數},kd表示頻率分辨的采樣點,kd?=?b*D+d-1。
4.根據權利要求3所述的基于譜時幅度分級向量辨識環境聲音事件的方法,其特征在于:在步驟3中,對子采樣譜Yd進行信號增強處理,將子采樣譜Yd轉換成信號增強的子采樣譜Xd,信號增強的譜X(k,?l)以及子采樣譜Xd表示如下:
X?~?[X?1,?X?2,?…X?d,?…,?X?D]
其中,D表示對頻譜Y每隔D個頻率分辨點采一個點作為頻率分辨點,即把頻譜圖Y分解成子譜Yd的數量,d表示頻率分辨采樣子譜圖的索引,d∈(1,2,?…?,D),X?d表示一個(N/D)×L的矩陣,Xd可以表示為:
Xd(b,?l)?=?X?(?kd,?l?)
其中,b表示子譜Xd在譜X中進行頻率采樣的索引,b∈(0,?1,?…,?N/D-1),N/D表示子譜Xd的行數,N/D∈{正整數},kd表示頻率分辨的采樣點,kd?=?b*D+d-1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201210242825.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種透氣鞋墊
- 下一篇:帶USB接口的電熱服





