[發明專利]一種識別惡意用戶的方法、裝置及存儲介質有效
| 申請號: | 201811161527.7 | 申請日: | 2018-09-30 |
| 公開(公告)號: | CN109255391B | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 王非池 | 申請(專利權)人: | 武漢斗魚網絡科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/9535;H04N21/4788;H04N21/488 |
| 代理公司: | 北京眾達德權知識產權代理有限公司 11570 | 代理人: | 徐松 |
| 地址: | 430000 湖北省武漢市東湖開*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 惡意 用戶 方法 裝置 存儲 介質 | ||
本發明實施例提供了一種識別惡意用戶的方法、裝置及存儲介質,該方法包括:獲取訓練樣本集,訓練樣本集包括訓練樣本的特征以及與訓練樣本對應的標簽,所述訓練樣本對應的標簽用于標識用戶是否為惡意用戶;從訓練樣本集中確定最優的切分特征與切分閾值;將訓練樣本集分裂處理,得到第一樣本集和第二樣本集,將第一樣本集和所述第二樣本集中各特征的均值作為目標輸出值;根據目標輸出值判斷用戶的是否為惡意用戶;將第一樣本集和第二樣本集中判斷為惡意用戶的訓練樣本對應的標簽設置為惡意用戶,以及將判斷為非惡意用戶的訓練樣本對應的標簽設置為非惡意用戶。通過采用該方案,能夠準確的分析用戶的行為特征,根據行為特征識別出惡意用戶。
技術領域
本發明涉及軟件技術領域,尤其涉及一種識別惡意用戶的方法、裝置及存儲介質。
背景技術
在直播平臺發展過程中,一些黑產團體為了達到私人目的,常常會批量注冊許多平臺賬號,使用這些賬號刷評論、刷彈幕和刷人氣等惡意行為,企圖刷高某個直播間的熱度,使得整個直播平臺的資源出現不平等的現象,從中獲利。直播平臺需要對這些惡意賬號的用戶進行封禁處理,然而,惡意賬號的行為難以從海量數據中直接挖掘。利用算法進行惡意用戶挖掘是一個可行的思路。
惡意用戶由于是黑產批量操作,其行為與動作往往具有一定的相似性,與正常用戶的行為模式有一定差異。常見的惡意用戶分類算法有決策樹、支撐向量機、感知機等算法。這些算法往往是基于對惡意用戶的判別,無法給出連續分布的惡意用戶評價指標,基于這些算法創建的模型針對惡意用戶的挖掘結果難以人工調控。并且挖掘結果的可解釋性較差,無法自動形成對判別結果的理由解釋。
發明內容
本發明實施例提供了一種識別惡意用戶的方法、裝置及存儲介質,用于解決現有機制中挖掘惡意用戶的準確性較低的問題。
第一方面,本發明提供了一種識別惡意用戶的方法,該方法包括:
獲取訓練樣本集,所述訓練樣本集為回歸樹結構,所述訓練樣本集包括訓練樣本的特征以及與訓練樣本對應的標簽,所述訓練樣本對應的標簽用于標識用戶是否為惡意用戶;
從所述訓練樣本集中確定最優的切分特征與切分閾值;
將所述訓練樣本集分裂處理,得到第一樣本集和第二樣本集,所述第一樣本集是指特征的取值不小于所述切分閾值的特征集,所述第二樣本集是指特征的取值大于所述切分閾值的特征集;
將所述第一樣本集和所述第二樣本集中各特征的均值作為目標輸出值;
根據所述目標輸出值判斷用戶的是否為惡意用戶;
將所述第一樣本集和所述第二樣本集中判斷為惡意用戶的訓練樣本對應的標簽設置為惡意用戶,以及將所述第一樣本集和所述第二樣本集中判斷為非惡意用戶的訓練樣本對應的標簽設置為非惡意用戶。
在一些可能的設計中,所述目標輸出值用于評估用戶的惡意等級。
在一些可能的設計中,所述訓練樣本的特征至少包括用戶的異常彈幕數量、用戶播放數量、用戶在第一時段內發表的評論數量、用戶在第二時段內發表的相同評論數量和用戶賬戶余額。
在一些可能的設計中,所述方法還包括:
設置封禁閾值;
所述根據所述目標輸出值判斷用戶的是否為惡意用戶,包括:
若所述目標輸出值大于所述封禁閾值,則確定用戶的惡意等級滿足惡意用戶的判斷條件。
在一些可能的設計中,所述訓練樣本包括第一特征、第二特征和第三特征,所述根據所述目標輸出值判斷用戶的是否為惡意用戶之后,方法還包括:
生成反饋結果,所述反饋結果包括:所述第一特征的取值不大于第一數值,所述第二特征大于第二數值,所述第三特征不大于第三數值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢斗魚網絡科技有限公司,未經武漢斗魚網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201811161527.7/2.html,轉載請聲明來源鉆瓜專利網。





