[發(fā)明專利]一種基于冪律分布確認刷贊用戶的方法及裝置有效
| 申請?zhí)枺?/td> | 202010796580.5 | 申請日: | 2020-08-10 |
| 公開(公告)號: | CN112115324B | 公開(公告)日: | 2023-10-24 |
| 發(fā)明(設(shè)計)人: | 王嘉偉 | 申請(專利權(quán))人: | 微夢創(chuàng)科網(wǎng)絡(luò)科技(中國)有限公司 |
| 主分類號: | G06F16/9038 | 分類號: | G06F16/9038;G06F17/18;G06Q50/00;H04L61/2503 |
| 代理公司: | 北京卓嵐智財知識產(chǎn)權(quán)代理有限公司 11624 | 代理人: | 蔡永波 |
| 地址: | 100193 北京市海淀區(qū)東北旺西路中關(guān)村*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 分布 確認 用戶 方法 裝置 | ||
本發(fā)明實施例提供一種基于冪律分布確認刷贊用戶的方法及裝置,實時獲取當(dāng)前時間之前的第一設(shè)定周期內(nèi)為某網(wǎng)絡(luò)活動發(fā)起點贊的IP以及各IP的點贊數(shù)量;并與當(dāng)前的點贊閾值進行比對;當(dāng)某個IP在第一設(shè)定周期內(nèi)為該網(wǎng)絡(luò)活動發(fā)起的點贊數(shù)量不小于當(dāng)前的點贊閾值時,判定該IP為刷贊IP;采用冪律分布對為該網(wǎng)絡(luò)活動發(fā)起點贊的IP數(shù)量以及各IP的點贊數(shù)量進行擬合,得到冪律分布擬合曲線,根據(jù)冪律分布擬合曲線得到該網(wǎng)絡(luò)活動點贊數(shù)據(jù)的擬合優(yōu)度;根據(jù)得到的該網(wǎng)絡(luò)活動點贊數(shù)據(jù)的擬合優(yōu)度修正當(dāng)前的點贊閾值。通過對一定時間內(nèi)點贊數(shù)量過高的網(wǎng)絡(luò)活動進行數(shù)據(jù)挖掘,使用基于冪律分布對點贊數(shù)據(jù)進行分析,有效的降低對正常用戶的誤傷。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)分析領(lǐng)域,具體涉及一種基于冪律分布確認刷贊用戶的方法及裝置。
背景技術(shù)
在現(xiàn)代的社交媒體的互聯(lián)網(wǎng)帳號中,點贊是一種非常重要的互動行為。于是出現(xiàn)大量不法分子利用腳本批量的刷贊,發(fā)起刷贊行為的用戶就是刷贊用戶。刷贊是對普通用戶和對平臺都不利的,要想辦法找出來?,F(xiàn)有技術(shù)中,通過統(tǒng)計點贊用戶的每個IP的發(fā)起贊的數(shù)量n,簡單通過閾值判斷na實現(xiàn)。
在實現(xiàn)本發(fā)明過程中,申請人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題:
在實際操作中,有些IP是小區(qū)出口IP,或者有些IP是機房IP,這種簡單閾值判斷極易誤傷或者放過一部分刷贊。閾值a是極難確定的,需要人工經(jīng)驗來定義。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種基于冪律分布確認刷贊用戶的方法及裝置,通過對一定時間內(nèi)點贊數(shù)量過高的網(wǎng)絡(luò)活動進行數(shù)據(jù)挖掘,使用基于冪律分布對點贊數(shù)據(jù)進行分析,自適應(yīng)的自動調(diào)整攔截用戶的點贊閾值有效提高刷贊的攔截量,有效的降低對正常用戶的誤傷。
為達上述目的,一方面,本發(fā)明實施例提供一種基于冪律分布確認刷贊用戶的方法,包括:
針對具有互動性的網(wǎng)絡(luò)活動,實時獲取當(dāng)前時間之前的第一設(shè)定周期內(nèi)為該網(wǎng)絡(luò)活動發(fā)起點贊的IP以及各IP的點贊數(shù)量;
將每個IP在第一設(shè)定周期內(nèi)為該網(wǎng)絡(luò)活動發(fā)起的點贊數(shù)量與當(dāng)前的點贊閾值進行比對;
當(dāng)某個IP在第一設(shè)定周期內(nèi)為該網(wǎng)絡(luò)活動發(fā)起的點贊數(shù)量不小于當(dāng)前的點贊閾值時,判定該IP為刷贊IP,該刷贊IP所對應(yīng)的用戶為刷贊用戶,所述刷贊IP是指參與該網(wǎng)絡(luò)活動時違規(guī)批量點贊的IP;
其中,所述點贊閾值通過如下方法周期性修正:
周期性獲取第二設(shè)定周期內(nèi)為該網(wǎng)絡(luò)活動發(fā)起的點贊總數(shù);
當(dāng)在第二設(shè)定周期內(nèi)為該網(wǎng)絡(luò)活動發(fā)起的點贊總數(shù)大于第一預(yù)設(shè)值時,統(tǒng)計為該網(wǎng)絡(luò)活動發(fā)起點贊的IP數(shù)量以及各IP的點贊數(shù)量;并
采用冪律分布對為該網(wǎng)絡(luò)活動發(fā)起點贊的IP數(shù)量以及各IP的點贊數(shù)量進行擬合,得到冪律分布擬合曲線,根據(jù)冪律分布擬合曲線得到該網(wǎng)絡(luò)活動點贊數(shù)據(jù)的擬合優(yōu)度;根據(jù)得到的該網(wǎng)絡(luò)活動點贊數(shù)據(jù)的擬合優(yōu)度修正當(dāng)前的點贊閾值。
另一方面,本發(fā)明實施例提供一種基于冪律分布確認刷贊用戶的裝置,包括:
統(tǒng)計模塊,用于針對具有互動性網(wǎng)絡(luò)活動,實時獲取當(dāng)前時間之前的第一設(shè)定周期內(nèi)為其發(fā)起點贊的IP以及各IP的點贊數(shù)量;
比對模塊,用于針對具有互動性的網(wǎng)絡(luò)活動,實時獲取當(dāng)前時間之前的第一設(shè)定周期內(nèi)為該網(wǎng)絡(luò)活動發(fā)起點贊的IP以及各IP的點贊數(shù)量;
比對模塊,用于將每個IP在第一設(shè)定周期內(nèi)為該網(wǎng)絡(luò)活動發(fā)起的點贊數(shù)量與當(dāng)前的點贊閾值進行比對;
判定模塊,用于當(dāng)某個IP在第一設(shè)定周期內(nèi)為該網(wǎng)絡(luò)活動發(fā)起的點贊數(shù)量不小于當(dāng)前的點贊閾值時,判定該IP為刷贊IP,該刷贊IP所對應(yīng)的用戶為刷贊用戶,所述刷贊IP是指參與該網(wǎng)絡(luò)活動時違規(guī)批量點贊的IP;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微夢創(chuàng)科網(wǎng)絡(luò)科技(中國)有限公司,未經(jīng)微夢創(chuàng)科網(wǎng)絡(luò)科技(中國)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010796580.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





