[發明專利]惡意語音樣本的確定方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202110498059.8 | 申請日: | 2021-05-08 |
| 公開(公告)號: | CN113205801A | 公開(公告)日: | 2021-08-03 |
| 發明(設計)人: | 計哲;黃遠;孫曉晨;沈亮;李鵬;萬辛;倪善金;譚澤龍;郭敏;張衛強 | 申請(專利權)人: | 國家計算機網絡與信息安全管理中心;清華大學 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/08;G10L15/22;G10L15/26 |
| 代理公司: | 北京華進京聯知識產權代理有限公司 11606 | 代理人: | 樊春燕 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 惡意 語音 樣本 確定 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種惡意語音樣本的確定方法,其特征在于,所述方法包括:
獲取初始語音樣本集;
根據預設的多種惡意類別對所述初始語音樣本集進行分類,得到所述多種惡意類別中每種惡意類別對應的語音樣本子集;
根據所述每種惡意類別對應的語音樣本子集中的語音樣本信息,計算所述每種惡意類別對應的語音樣本子集的惡意度;
將所述惡意度滿足預設惡意度條件的惡意類別對應的語音樣本子集中的語音樣本,確定為惡意語音樣本。
2.根據權利要求1所述的方法,其特征在于,所述將所述惡意度滿足預設惡意度條件的惡意類別對應的語音樣本子集中的語音樣本,確定為惡意語音樣本,包括:
獲取所述每種惡意類別對應的語音樣本子集中的語音樣本的第一數量;
獲取所述每種惡意類別對應的語音樣本子集中添加有負向標記的語音樣本的第二數量,其中,所述負向標記用于指示所述語音樣本中包含負面語音內容;
根據所述第二數量與所述第一數量的比值,確定所述每種惡意類別對應的語音樣本子集的惡意度。
3.根據權利要求2所述的方法,其特征在于,所述根據所述第二數量與所述第一數量的比值,確定所述每種惡意類別對應的語音樣本子集的惡意度,包括:
計算所述第二數量與所述第一數量的比值,得到所述每種惡意類別對應的語音樣本子集的負面反饋因子;
獲取所述初始語音樣本集中的語音樣本的第三數量;
計算所述第一數量與所述第三數量的比值,得到所述每種惡意類別對應的語音樣本子集的傳播影響因子;
根據所述負面反饋因子和所述傳播影響因子,計算所述每種惡意類別對應的語音樣本子集的惡意度。
4.根據權利要求1所述的方法,其特征在于,所述方法還包括:
獲取多個候選分類數量以及每個候選分類數量對應的語音分類模型,其中,所述每個候選分類數量對應的語音分類模型中的每個語音分類模型用于處理一種候選惡意類別的分類任務;
針對所述每個候選分類數量,將所述初始語音樣本集中的每個語音樣本分別輸入至所述候選分類數量對應的語音分類模型進行多種候選惡意類別的分類,得到所述每個語音樣本所屬多種候選惡意類別對應的多個置信度;
針對所述每個候選分類數量,從所述每個語音樣本所屬的多種候選惡意類別中選取所述置信度滿足預設的第一置信度條件的候選惡意類別,確定為所述每個語音樣本所屬的第一惡意類別;
針對所述每個候選分類數量,根據所述每個語音樣本所屬第一惡意類別對應的第一置信度和所述每個語音樣本所屬第二惡意類別對應的第二置信度,確定所述每個候選分類數量對應的分類契合度總和,其中,所述第二惡意類別為所述多種候選惡意類別中除所述第一惡意類別之外的候選惡意類別;
將所述多個候選分類數量中所述分類契合度總和滿足預設契合度總和條件的候選分類數量對應的多種候選惡意類別,確定為所述預設的多種惡意類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心;清華大學,未經國家計算機網絡與信息安全管理中心;清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202110498059.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電子膨脹閥和制冷設備
- 下一篇:用于裝配式疊合梁板的施工方法





