[發明專利]基于事先知識的說話者檢驗及說話者識別系統和方法有效
| 申請號: | 01125917.5 | 申請日: | 2001-07-05 |
| 公開(公告)號: | CN1366295A | 公開(公告)日: | 2002-08-28 |
| 發明(設計)人: | 羅蘭德·庫恩;奧利弗·史耶斯;帕特里克·安古因;吉恩-克勞德·君夸;羅伯特·博曼 | 申請(專利權)人: | 松下電器產業株式會社 |
| 主分類號: | G10L17/00 | 分類號: | G10L17/00 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 | 代理人: | 李德山 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 事先 知識 說話 檢驗 識別 系統 方法 | ||
1.用于根據預定客戶說話者的語音估計語音的方法,包括步驟:
依據來自多個訓練說話者的語音訓練一組語音模型;
從這組語音模型構成一個說話者空間以表示所述多個訓練說話者;
以一個在所述說話者空間中的第一位置表示來自所述客戶說話者的登記語音,和
基于該第一位置和來自新說話者的新語音數據確定該新說話者是否為該客戶說話者。
2.權利要求1的方法,進一步包括步驟:
從該第一位置產生一個概率語音模型;和
估計該概率語音模型和該新的語音數據之間的似然性并利用所述估計值作為該新的說話者是否為該客戶說話者的指示。
3.權利要求1的方法,進一步包括步驟:
利用所述語音數據產生一個該新的說話者的表示,作為該說話者空間中的一個第二位置;和
估計該第一和第二位置之間的接近度并利用所述估計值作為該新的說話者是否為該客戶說話者的指示。
4.權利更求1的方法,進一步包括步驟:
依據來自該客戶說話者的登記語音上訓練一個登記語音模型;和
產生一個該客戶說話者的表示,作為該說話者空間中的該第一位置。
5.權利要求4的方法,進一步包括當該登記語音滿足預定的條件時,依據來自該客戶說話者的附加語音訓練該登記的語音模型的步驟。
6.權利要求5的方法,其中該登記語音包括一個第一發音和一個第二發音,該方法進一步包括定義該預定的條件以包括該說話者空間中的所述第一發音的位置的步驟,該位置離該說話者空間中所述第二言論的位置有一個預定距離。
7.權利要求5的方法,進一步包括定義該預定的條件以包括該第一位置,其位于說話者空間的具有一個預定密度的一個區域內的步驟。
8.權利更求1的方法,進一步包括訓練一組不依賴于文本的語音模型的步驟。
9.權利要求1的方法,進一步包括訓練一組依賴于文本的語音模型的步驟。
10.權利要求1的方法,進一步包括步驟:
對每個所述訓練說話者獲得一個依賴于說話者的超矢量;和
基于該依賴于說話者的超矢量產生一個比該語音模型的維度低的說話者空間。
11.權利要求10的方法,進一步包括步驟:
獲得全部的說話者內的散射矩陣數據;和
基于該矩陣數據執行維度降低。
12.權利要求1的方法,進一步包括重新估計該說話者空間的步驟。
13.權利要求1的方法,進一步包括基于關于一個客戶登記環境的信息修改該說話者空間的步驟。
14.權利要求1的方法,進一步包括估計所述第一和第二位置之間的接近度并利用所述估計值作為該新的說話者是否該客戶說話者的指示的步驟。
15.權利要求1的方法,其中該多個訓練說話者包括該客戶說話者。
16.權利要求1的方法,其中該多個訓練說話者不包括該客戶說話者。
17.權利要求1的方法,進一步包括通過降低每個訓練說話者的語音模型的自由度的數量構成該說話者空間的步驟。
18.權利要求1的方法,進一步包括執行說話者識別的步驟。
19.權利要求1的方法,進一步包括通過判定該新的說話者是否該客戶說話者或一個冒充者執行說話者檢驗的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于松下電器產業株式會社,未經松下電器產業株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/01125917.5/1.html,轉載請聲明來源鉆瓜專利網。





