[發(fā)明專利]動態(tài)自適應(yīng)網(wǎng)絡(luò)敏感信息檢測方法及裝置有效
| 申請?zhí)枺?/td> | 201811085661.3 | 申請日: | 2018-09-18 |
| 公開(公告)號: | CN109284441B | 公開(公告)日: | 2020-12-04 |
| 發(fā)明(設(shè)計)人: | 魏晗;陳剛;郭志剛;唐永旺;席耀一;袁江林 | 申請(專利權(quán))人: | 中國人民解放軍戰(zhàn)略支援部隊信息工程大學(xué) |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/31 |
| 代理公司: | 鄭州大通專利商標(biāo)代理有限公司 41111 | 代理人: | 周艷巧 |
| 地址: | 450000 河*** | 國省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 動態(tài) 自適應(yīng) 網(wǎng)絡(luò) 敏感 信息 檢測 方法 裝置 | ||
1.一種動態(tài)自適應(yīng)網(wǎng)絡(luò)敏感信息檢測方法,其特征在于,包含如下內(nèi)容:
針對采集到的網(wǎng)絡(luò)敏感文本流,通過構(gòu)建倒排索引和進(jìn)行多關(guān)鍵詞檢索獲取滿足過濾規(guī)則的文檔列表;
針對獲取到的文檔列表,依據(jù)用戶需求程度并通過關(guān)鍵詞評分獲取文檔綜合得分,依據(jù)綜合得分對互聯(lián)網(wǎng)敏感信息進(jìn)行檢測;
通過構(gòu)建倒排索引和進(jìn)行多關(guān)鍵詞檢索獲取滿足過濾規(guī)則的文檔列表,包括如下內(nèi)容:
設(shè)置啟動開關(guān),滿足批處理操作條件時,通過觸發(fā)啟動開關(guān)對采集到的網(wǎng)絡(luò)敏感文本流進(jìn)行批量處理獲取滿足過濾規(guī)則的文檔列表;批處理操作條件為預(yù)設(shè)批處理操作時間間隔,或為未處理文檔達(dá)到預(yù)設(shè)規(guī)模;多關(guān)鍵檢索過程中,通過邏輯運算進(jìn)行關(guān)鍵詞組合來構(gòu)建過濾規(guī)則;
以詞項為鍵值構(gòu)建文檔數(shù)據(jù)集的內(nèi)存倒排索引,然后以過濾規(guī)則為查詢對象,解析過濾規(guī)則得到多個檢索關(guān)鍵詞,根據(jù)過濾規(guī)則的組合方式對多個關(guān)鍵詞的檢索結(jié)果進(jìn)行融合得到滿足該過濾規(guī)則的文檔列表;遍歷過濾規(guī)則,得到滿足過濾規(guī)則的文檔集合,清空內(nèi)存倒排索引;
依據(jù)用戶需求程度并通過關(guān)鍵詞評分獲取文檔綜合得分,包含如下內(nèi)容:
針對樣本數(shù)據(jù)庫中文檔集合,利用詞頻逆文檔頻率獲取關(guān)鍵詞在文檔集合中的權(quán)重,并通過該權(quán)重及關(guān)鍵詞在文檔集合中出現(xiàn)頻次和過濾規(guī)則中預(yù)先設(shè)定的關(guān)鍵詞預(yù)設(shè)分值來獲取過濾規(guī)則中關(guān)鍵詞的基礎(chǔ)得分;
針對實際獲取到的文檔列表,通過文檔列表中包含關(guān)鍵詞的文檔數(shù)及樣本數(shù)據(jù)庫文檔集合包含關(guān)鍵詞的文檔數(shù)來修正關(guān)鍵詞的基礎(chǔ)評分,通過實時獲取到的網(wǎng)絡(luò)敏感文本流來動態(tài)修正關(guān)鍵詞基礎(chǔ)評分,動態(tài)修正公式表示為:
其中,Scorej為修正后的分值,Snj為樣本數(shù)據(jù)集中包含關(guān)鍵詞Kj的文檔數(shù),BaseScorej為關(guān)鍵詞的基礎(chǔ)得分,nj為文檔集合中包含關(guān)鍵詞Kj的文檔數(shù)量;
依據(jù)關(guān)鍵詞基礎(chǔ)評分,并通過過濾規(guī)則中關(guān)鍵詞組合邏輯來獲取最終判定的文檔得分。
2.根據(jù)權(quán)利要求1所述的動態(tài)自適應(yīng)網(wǎng)絡(luò)敏感信息檢測方法,其特征在于,對采集到的網(wǎng)絡(luò)敏感文本流,首先進(jìn)行預(yù)處理,過濾出包含敏感詞變形體的文本信息,其中,敏感詞變形體至少包含敏感詞火星文變形和敏感詞散光字變形;敏感詞火星文變形的過濾中,通過面向信息檢索的中文分詞,并以同時包含單字和多字的分詞結(jié)果作為索引詞項來構(gòu)建文檔的倒排索引,在綜合過濾規(guī)則查詢結(jié)果時,自動過濾火星文變形;敏感詞散光字變形的過濾中,通過構(gòu)建散光字字典,將過濾規(guī)則進(jìn)行變形擴(kuò)展后再進(jìn)行檢索過濾。
3.根據(jù)權(quán)利要求2所述的動態(tài)自適應(yīng)網(wǎng)絡(luò)敏感信息檢測方法,其特征在于,依據(jù)過濾規(guī)則中關(guān)鍵詞組合邏輯獲取最終判定的文檔得分中,對于只包含兩個關(guān)鍵詞的文檔,若過濾規(guī)則中關(guān)鍵詞是邏輯與的關(guān)系,則最終判定的文檔得分為修正后的兩個關(guān)鍵詞基礎(chǔ)得分之和;若過濾規(guī)則中關(guān)鍵詞是邏輯或的關(guān)系,則最終判定的文檔得分為在修正后的兩個關(guān)鍵詞基礎(chǔ)得分中選取最大值;對于包含多個關(guān)鍵詞的文檔,則按照過濾規(guī)則中關(guān)鍵詞邏輯關(guān)系順序依次推導(dǎo)來獲取最終判定的文檔得分;對于存在多個過濾規(guī)則的文檔,則分別計算每個過濾規(guī)則的得分,然后取其中最大值作為最終判定的文檔得分。
4.一種動態(tài)自適應(yīng)網(wǎng)絡(luò)敏感信息檢測裝置,其特征在于,基于權(quán)利要求1所述的動態(tài)自適應(yīng)網(wǎng)絡(luò)敏感信息檢測方法實現(xiàn),包含:
過濾模塊,針對采集到的網(wǎng)絡(luò)敏感文本流,通過構(gòu)建倒排索引和進(jìn)行多關(guān)鍵詞檢索獲取滿足過濾規(guī)則的文檔列表;
評分模塊,針對獲取到的文檔列表,依據(jù)用戶需求程度并通過關(guān)鍵詞評分獲取文檔綜合得分,依據(jù)綜合得分對互聯(lián)網(wǎng)敏感信息進(jìn)行檢測。
5.根據(jù)權(quán)利要求4所述的動態(tài)自適應(yīng)網(wǎng)絡(luò)敏感信息檢測裝置,其特征在于,所述的過濾模塊包含索引子模塊、開關(guān)子模塊和檢索子模塊,其中,
索引子模塊,將采集到的網(wǎng)絡(luò)敏感文本流作為檢索文檔數(shù)據(jù)集,以詞項為鍵值建立檢索文檔數(shù)據(jù)集的內(nèi)存倒排索引;
開關(guān)子模塊,用于通過設(shè)置啟動開關(guān),針對滿足預(yù)設(shè)批處理操作條件的情形,通過啟動開關(guān)觸發(fā)檢索子模塊;
檢索子模塊,用于通過對過濾規(guī)則中關(guān)鍵詞進(jìn)行邏輯組合來獲取滿足過濾規(guī)則的文檔列表。
6.根據(jù)權(quán)利要求4所述的動態(tài)自適應(yīng)網(wǎng)絡(luò)敏感信息檢測裝置,其特征在于,所述的評分模塊包含基礎(chǔ)評分子模塊,評分修正子模塊和綜合判定子模塊,其中,
基礎(chǔ)評分子模塊,用于針對樣本數(shù)據(jù)庫中文檔集合,利用詞頻逆文檔頻率獲取關(guān)鍵詞在文檔集合中的權(quán)重,并通過該權(quán)重及關(guān)鍵詞在文檔集合中出現(xiàn)頻次和過濾規(guī)則中預(yù)先設(shè)定的關(guān)鍵詞預(yù)設(shè)分值來獲取過濾規(guī)則中關(guān)鍵詞的基礎(chǔ)得分;
評分修正子模塊,用于針對實際獲取到的文檔列表,通過文檔列表中包含關(guān)鍵詞的文檔數(shù)及樣本數(shù)據(jù)庫文檔集合包含關(guān)鍵詞的文檔數(shù)來修正關(guān)鍵詞的基礎(chǔ)評分;
綜合判定子模塊,用于依據(jù)修正后的關(guān)鍵詞基礎(chǔ)評分,并通過過濾規(guī)則中關(guān)鍵詞組合邏輯來獲取最終判定的文檔得分。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍戰(zhàn)略支援部隊信息工程大學(xué),未經(jīng)中國人民解放軍戰(zhàn)略支援部隊信息工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201811085661.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 使用后向自適應(yīng)規(guī)則進(jìn)行整數(shù)數(shù)據(jù)的無損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺
- 采用自適應(yīng)機匣和自適應(yīng)風(fēng)扇的智能發(fā)動機
- 一種自適應(yīng)樹木自動涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動機燃?xì)庾赃m應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





