[發(fā)明專利]一種快速識別聲紋方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 201610025045.3 | 申請日: | 2016-01-14 |
| 公開(公告)號: | CN106971728A | 公開(公告)日: | 2017-07-21 |
| 發(fā)明(設(shè)計)人: | 祝銘明 | 申請(專利權(quán))人: | 芋頭科技(杭州)有限公司 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/04;G10L17/08 |
| 代理公司: | 上海申新律師事務(wù)所31272 | 代理人: | 黨蕾 |
| 地址: | 310000 浙江省杭州市余杭區(qū)*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 快速 識別 聲紋 方法 系統(tǒng) | ||
1.一種快速識別聲紋方法,其特征在于,包括:
獲取每個未識別聲紋中的未識別聲紋特征,其中,所述未識別聲紋特征中至少包括所述未識別聲紋的小波元素;
至少分別根據(jù)每個所述未識別聲紋特征與聲紋識別模型中的標(biāo)準(zhǔn)聲紋特征處理得到對應(yīng)于每個所述未識別聲紋的辨別度;
分別判斷每個所述辨別度是否大于一預(yù)設(shè)的標(biāo)準(zhǔn)閾值,并保留所述辨別度大于所述標(biāo)準(zhǔn)閾值的所述未識別聲紋;
于被保留的所述未識別聲紋中,選擇所述辨別度最大的所述未識別聲紋并識別為被鎖定聲紋;
當(dāng)所述未識別聲紋被識別為鎖定聲紋時,對所述聲紋識別模型對應(yīng)形成一識別記錄,
對所述識記錄進(jìn)行統(tǒng)計,并對應(yīng)形成統(tǒng)計結(jié)果;
根據(jù)所述統(tǒng)計結(jié)果將對應(yīng)的所述識別模型進(jìn)行降序排序;
所述小波元素包括實小波元素和/或復(fù)小波元素,其中,所述獲取未識別聲紋中的未識別聲紋特征包括:
檢測所述未識別聲紋中的濁音區(qū)間;
在每個所述濁音區(qū)間中檢測基音區(qū)間,并在每個所述基音區(qū)間中獲取所述聲紋特征的所述實小波元素和/或所述復(fù)小波元素。
2.根據(jù)權(quán)利要求1所述的快速識別聲紋方法,其特征在于,在所述提取未識別聲紋中的未識別聲紋特征之前,還包括:
采集所述未識別聲紋;
至少根據(jù)所述未識別聲紋特征中的未識別聲紋特征向量調(diào)整預(yù)先構(gòu)建的標(biāo)準(zhǔn)識別模型中與所述未識別聲紋特征向量對應(yīng)的聲紋特征向量參數(shù),以構(gòu)造出與所述未識別聲紋相適應(yīng)的所述聲紋識別模型中的所述標(biāo)準(zhǔn)聲紋特征中的標(biāo)準(zhǔn)聲紋特征向量。
3.根據(jù)權(quán)利要求2所述的快速識別聲紋方法,其特征在于,所述未識別聲紋特征中包括多個所述未識別聲紋特征向量,所述標(biāo)準(zhǔn)聲紋特征中包括多個所述標(biāo)準(zhǔn)聲紋特征向量,其中,所述至少根據(jù)所述未識別聲紋特征與聲紋識 別模型中的標(biāo)準(zhǔn)聲紋特征處理得到所述未識別聲紋的辨別度包括:
處理得到所述未識別聲紋特征中的每個所述未識別聲紋特征向量與所述標(biāo)準(zhǔn)聲紋特征中每個與所述未識別聲紋特征向量相對應(yīng)的所述標(biāo)準(zhǔn)聲紋特征向量的向量距離;
根據(jù)處理得到的多個所述向量距離處理得到所述未識別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離;
至少利用所述未識別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的所述目標(biāo)距離處理得到所述未識別聲紋的辨別度。
4.根據(jù)權(quán)利要求3所述的快速識別聲紋方法,其特征在于,在采集所述未識別聲紋之前,還包括:
采集多個聲紋并獲取所述多個聲紋中每個聲紋的背景聲紋特征,以構(gòu)建多個與所述聲紋相對應(yīng)的背景識別模型,其中,所述背景聲紋特征中包括多個背景聲紋特征向量;
根據(jù)所述背景識別模型構(gòu)建所述標(biāo)準(zhǔn)識別模型。
5.根據(jù)權(quán)利要求4所述的快速識別聲紋方法,其特征在于,所述至少利用所述未識別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的距離處理得到所述未識別聲紋的辨別度包括:
處理得到所述未識別聲紋特征分別與多個所述背景識別模型對應(yīng)的每個所述聲紋的所述背景聲紋特征的背景距離;
根據(jù)多個所述背景距離處理得到距離平均值及距離標(biāo)準(zhǔn)差;
處理得到所述未識別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的所述目標(biāo)距離與所述距離平均值的差值;
處理得到所述差值與所述距離標(biāo)準(zhǔn)差的比值,將所述比值作為所述未識別聲紋的所述辨別度。
6.根據(jù)權(quán)利要求1所述的快速識別聲紋方法,其特征在于,所述在每個所述基音區(qū)間中獲取所述聲紋特征的所述實小波元素和/或所述復(fù)小波元素包括:
在每個所述基音區(qū)間中獲取預(yù)定的特征向量,并根據(jù)小波濾波器將多個所述基音區(qū)間中的所述特征向量劃分為預(yù)定長度的樣本向量,并將所述預(yù)定長度的樣本向量歸一化;
對歸一化后的所述預(yù)定長度的樣本向量執(zhí)行以下至少一種小波變換:
對歸一化后的所述預(yù)定長度的樣本向量進(jìn)行實小波變換,以得到第一預(yù)定頻帶的實部系數(shù),并在所述第一預(yù)定頻帶中選擇滿足第一預(yù)定條件的頻帶進(jìn)行采樣,以得到所述未識別聲紋特征中的所述實小波元素;
對歸一化后的所述預(yù)定長度的樣本向量進(jìn)行雙樹復(fù)小波變換,以得到第二預(yù)定頻帶的實部系數(shù)和虛部系數(shù),并在所述第二預(yù)定頻帶中選擇滿足第二預(yù)定條件的頻帶進(jìn)行采樣,以得到所述未識別聲紋特征中的所述復(fù)小波元素。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于芋頭科技(杭州)有限公司,未經(jīng)芋頭科技(杭州)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201610025045.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





