[發(fā)明專利]惡意語音樣本的確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110498059.8 | 申請日: | 2021-05-08 |
| 公開(公告)號: | CN113205801A | 公開(公告)日: | 2021-08-03 |
| 發(fā)明(設(shè)計(jì))人: | 計(jì)哲;黃遠(yuǎn);孫曉晨;沈亮;李鵬;萬辛;倪善金;譚澤龍;郭敏;張衛(wèi)強(qiáng) | 申請(專利權(quán))人: | 國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心;清華大學(xué) |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/08;G10L15/22;G10L15/26 |
| 代理公司: | 北京華進(jìn)京聯(lián)知識產(chǎn)權(quán)代理有限公司 11606 | 代理人: | 樊春燕 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 惡意 語音 樣本 確定 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲 介質(zhì) | ||
本申請涉及一種惡意語音樣本的確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)。該方法包括:獲取初始語音樣本集;根據(jù)預(yù)設(shè)的多種惡意類別對初始語音樣本集進(jìn)行分類,得到多種惡意類別中每種惡意類別對應(yīng)的語音樣本子集;根據(jù)每種惡意類別對應(yīng)的語音樣本子集中的語音樣本信息,計(jì)算每種惡意類別對應(yīng)的語音樣本子集的惡意度;將惡意度滿足預(yù)設(shè)惡意度條件的惡意類別對應(yīng)的語音樣本子集中的語音樣本,確定為惡意語音樣本。本方法基于語音樣本子集的惡意類別以及惡意度可自動(dòng)確定惡意語音樣本,有利于提高惡意語音樣本的確定效率。
技術(shù)領(lǐng)域
本申請涉及語音處理技術(shù)領(lǐng)域,特別是涉及一種惡意語音樣本的確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)。
背景技術(shù)
隨著語音傳輸技術(shù)的快速發(fā)展,出現(xiàn)了惡意語音檢測技術(shù)。惡意語音檢測技術(shù)是通過惡意語音檢測模型來檢測出惡意語音,例如詐騙語音,恐嚇語音等等。通常,為保證惡意語音檢測模型擁有較高的檢測性能,需要采用不斷更新的惡意語音樣本對惡意語音檢測模型進(jìn)行訓(xùn)練并修正。
傳統(tǒng)技術(shù)中,通常采用人工篩選方式確定惡意語音并進(jìn)行標(biāo)注,得到惡意語音樣本。
然而,采用傳統(tǒng)技術(shù),惡意語音樣本的確定效率較低。
發(fā)明內(nèi)容
基于此,有必要針對上述技術(shù)問題,提供一種能夠提高惡意語音樣本確定效率的惡意語音樣本的確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)。
一種惡意語音樣本的確定方法,所述方法包括:
獲取初始語音樣本集;
根據(jù)預(yù)設(shè)的多種惡意類別對所述初始語音樣本集進(jìn)行分類,得到所述多種惡意類別中每種惡意類別對應(yīng)的語音樣本子集;
根據(jù)所述每種惡意類別對應(yīng)的語音樣本子集中的語音樣本信息,計(jì)算所述每種惡意類別對應(yīng)的語音樣本子集的惡意度;
將所述惡意度滿足預(yù)設(shè)惡意度條件的惡意類別對應(yīng)的語音樣本子集中的語音樣本,確定為惡意語音樣本。
在其中一個(gè)實(shí)施例中,所述將所述惡意度滿足預(yù)設(shè)惡意度條件的惡意類別對應(yīng)的語音樣本子集中的語音樣本,確定為惡意語音樣本,包括:
獲取所述每種惡意類別對應(yīng)的語音樣本子集中的語音樣本的第一數(shù)量;
獲取所述每種惡意類別對應(yīng)的語音樣本子集中添加有負(fù)向標(biāo)記的語音樣本的第二數(shù)量,其中,所述負(fù)向標(biāo)記用于指示所述語音樣本中包含負(fù)面語音內(nèi)容;
根據(jù)所述第二數(shù)量與所述第一數(shù)量的比值,確定所述每種惡意類別對應(yīng)的語音樣本子集的惡意度。
在其中一個(gè)實(shí)施例中,所述根據(jù)所述第二數(shù)量與所述第一數(shù)量的比值,確定所述每種惡意類別對應(yīng)的語音樣本子集的惡意度,包括:
計(jì)算所述第二數(shù)量與所述第一數(shù)量的比值,得到所述每種惡意類別對應(yīng)的語音樣本子集的負(fù)面反饋因子;
獲取所述初始語音樣本集中的語音樣本的第三數(shù)量;
計(jì)算所述第一數(shù)量與所述第三數(shù)量的比值,得到所述每種惡意類別對應(yīng)的語音樣本子集的傳播影響因子;
根據(jù)所述負(fù)面反饋因子和所述傳播影響因子,計(jì)算所述每種惡意類別對應(yīng)的語音樣本子集的惡意度。
在其中一個(gè)實(shí)施例中,所述方法還包括:
獲取多個(gè)候選分類數(shù)量以及每個(gè)候選分類數(shù)量對應(yīng)的語音分類模型,其中,所述每個(gè)候選分類數(shù)量對應(yīng)的語音分類模型中的每個(gè)語音分類模型用于處理一種候選惡意類別的分類任務(wù);
針對所述每個(gè)候選分類數(shù)量,將所述初始語音樣本集中的每個(gè)語音樣本分別輸入至所述候選分類數(shù)量對應(yīng)的語音分類模型進(jìn)行多種候選惡意類別的分類,得到所述每個(gè)語音樣本所屬多種候選惡意類別對應(yīng)的多個(gè)置信度;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心;清華大學(xué),未經(jīng)國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心;清華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202110498059.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:電子膨脹閥和制冷設(shè)備
- 下一篇:用于裝配式疊合梁板的施工方法
- 惡意特征數(shù)據(jù)庫的建立方法、惡意對象檢測方法及其裝置
- 用于檢測惡意鏈接的方法及系統(tǒng)
- 惡意信息識別方法、惡意信息識別裝置及系統(tǒng)
- 主動(dòng)式移動(dòng)終端惡意軟件網(wǎng)絡(luò)流量數(shù)據(jù)集獲取方法及系統(tǒng)
- 一種大數(shù)據(jù)告警平臺系統(tǒng)及其方法
- 一種追溯惡意進(jìn)程的方法、裝置及存儲介質(zhì)
- 一種相似惡意軟件推薦方法、裝置、介質(zhì)和設(shè)備
- 軟件惡意行為檢測方法及系統(tǒng)
- 惡意樣本增強(qiáng)方法、惡意程序檢測方法及對應(yīng)裝置
- 惡意語音樣本的確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)





