[發(fā)明專利]風險檢測方法及裝置在審
| 申請?zhí)枺?/td> | 201610342117.7 | 申請日: | 2016-05-20 |
| 公開(公告)號: | CN107403251A | 公開(公告)日: | 2017-11-28 |
| 發(fā)明(設計)人: | 陳冬白 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06 |
| 代理公司: | 北京博思佳知識產(chǎn)權代理有限公司11415 | 代理人: | 陳蕾 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 風險 檢測 方法 裝置 | ||
1.一種風險檢測方法,其特征在于,所述方法包括:
獲取待檢測網(wǎng)站包括的一個或多個網(wǎng)頁的頁面信息;
根據(jù)所述一個或多個網(wǎng)頁的頁面信息計算設定風險類型的一個或多個網(wǎng)頁的頁面風險度;
根據(jù)所述一個或多個網(wǎng)頁的頁面風險度計算網(wǎng)站風險度。
2.根據(jù)權利要求1所述的方法,其特征在于,所述獲取待檢測網(wǎng)站包括的一個或多個網(wǎng)頁的頁面信息,包括:
通過爬蟲技術獲取所述一個或多個網(wǎng)頁的頁面信息;
根據(jù)域名等級和頁面瀏覽量PV值對所述一個或多個網(wǎng)頁的頁面信息進行排序。
3.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)所述一個或多個網(wǎng)頁的頁面信息計算設定風險類型的一個或多個網(wǎng)頁的頁面風險度,包括:
從第一網(wǎng)頁的頁面信息中提取出待檢測信息,所述第一網(wǎng)頁用于表征所述一個或多個網(wǎng)頁中任一網(wǎng)頁,所述待檢測信息包括文本信息和/或圖片信息;
計算所述待檢測信息與設定風險類型的樣本庫中的各個樣本的相似度;
從各個所述相似度中選取最大值,所述最大值為所述設定風險類型的第一網(wǎng)頁的頁面風險度。
4.根據(jù)權利要求3所述的方法,其特征在于,所述從第一網(wǎng)頁的頁面信息中提取出待匹配信息,包括:
當檢測到所述第一網(wǎng)頁的頁面信息中包括視頻信息時,則根據(jù)設定處理規(guī)則將所述視頻信息處理成圖片信息,所述設定處理規(guī)則為將視頻拆成幀,并每隔設定時間截取一幀圖片。
5.根據(jù)權利要求1至4任一項所述的方法,其特征在于,所述根據(jù)所述一個或多個網(wǎng)頁的頁面風險度計算網(wǎng)站風險度,包括:
根據(jù)域名等級對所述一個或多個網(wǎng)頁的頁面風險度進行分類,相同域名等級的頁面風險度歸為同一類;
計算第一類的頁面風險度和風險權重,所述第一類用于表征域名級頁面類型;
計算第二類的頁面風險度和風險權重,所述第二類用于表征各級域名頁面類型中任一種;
根據(jù)所述第一類的頁面風險度和風險權重、以及各個所述第二類的頁面風險度和風險權重計算所述網(wǎng)站風險度。
6.根據(jù)權利要求5所述的方法,其特征在于,所述計算第一類的頁面風險度和風險權重,包括:
從所述第一類的各個頁面風險度中選取最大值,所述最大值為所述第一類的頁面風險度;
判斷所述第一類的頁面風險度是否小于預設的第一頁面風險度閾值;若是,則將所述第一類的頁面風險度設置為第一設定權重值;若否,則將所述第一類的頁面風險度設置為第二設定權重值,所述第二設定權重值大于所述第一設定權重值。
7.根據(jù)權利要求6所述的方法,其特征在于,所述計算第二類的頁面風險度和風險權重,包括:
從所述第二類的各個頁面風險度中選取最大值;
判斷所述最大值是否小于預設的第二頁面風險度閾值;若是,則計算所述第二類中各個頁面風險度的平均值,所述平均值為所述第二類的頁面風險度;若否,則所述最大值為所述第二類的頁面風險度;
根據(jù)所述第一類的風險權重確定所述第二類的風險權重,所述第二類的風險權重小于所述第一類的風險權重。
8.根據(jù)權利要求7所述的方法,其特征在于,所述根據(jù)所述第一類的風險權重確定所述第二類的風險權重,包括:
根據(jù)所述第一類的風險權重、所述第二類的域名等級、以及所述待檢測網(wǎng)站的域名等級深度計算所述第二類的風險權重,所述第二類的風險權重小于所述第一類的風險權重,且與所述域名等級深度成反比。
9.根據(jù)權利要求3所述的方法,其特征在于,所述方法還包括:
設置至少一種設定風險類型的樣本庫。
10.根據(jù)權利要求1所述的方法,其特征在于,所述方法還包括:
當檢測到所述網(wǎng)站風險度大于預設的網(wǎng)站風險度閾值時,則輸出報警信息。
11.一種風險檢測裝置,其特征在于,所述裝置包括:
獲取單元,用于獲取待檢測網(wǎng)站包括的一個或多個網(wǎng)頁的頁面信息;
第一計算單元,用于根據(jù)所述一個或多個網(wǎng)頁的頁面信息計算設定風險類型的一個或多個網(wǎng)頁的頁面風險度;
第二計算單元,用于根據(jù)所述一個或多個網(wǎng)頁的頁面風險度計算網(wǎng)站風險度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201610342117.7/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





