[發明專利]一種面向云計算環境的跨站腳本漏洞挖掘方法及系統有效
| 申請號: | 201910933163.8 | 申請日: | 2019-09-29 |
| 公開(公告)號: | CN110708308B | 公開(公告)日: | 2021-08-17 |
| 發明(設計)人: | 陳晶;何琨;杜瑞穎;楊子康 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;H04L29/08;G06F8/60 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 魏波 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 計算 環境 腳本 漏洞 挖掘 方法 系統 | ||
1.一種面向云計算環境的跨站腳本漏洞挖掘方法,其特征在于,包括以下步驟:
步驟1:抓取HTTP協議的Web頁面;
其中,通過遍歷URL鏈接中的Web站點,且這些Web站點支持并遵循HTTP協議,自動的抽取Web站點層次結構,同時把URL鏈接增加到Web的層次結構中,找到含有參數的Web頁面;
步驟2:對Web頁面進行解析,以獲取Web頁面對應的DOM結構樹;同時,提取Web頁面中的嵌入式的URL鏈接及調用參數;
步驟3:根據URL鏈接及調用參數傳遞,檢索對應的外部JavaScript文件集,以獲取相關請求信息的腳本內容;
步驟4:檢索服務器返回的HTTP響應信息,獲取相關的腳本集;
步驟5:將得到的響應信息中的腳本集和從URL鏈接中檢索到的請求信息中的腳本集進行相似性檢測;通過是否檢測到相似性來判斷是否存在XSS漏洞;
具體實現包括以下子步驟:
步驟5.1:將獲取到的響應信息中的腳本集和從URL鏈接中檢索到的請求信息中的腳本集執行遞歸解碼,直到這兩個腳本集中的所有JS字符串都將以可讀形式進行轉換;
步驟5.2:針對解碼之后的腳本集內容,檢測字符串之間是否存在任何相似性;若在這兩組腳本之間檢測到任何相似性,則證明有XSS漏洞在。
2.根據權利要求1所述的面向云計算環境的跨站腳本漏洞挖掘方法,其特征在于:步驟2中,具體包括以下子步驟:
步驟2.1:下載網站的HTML頁面內容;
步驟2.2:將HTML內容進行解析,抓取其中的URL;
步驟2.3:對抓取到的URL鏈接進行處理,包括限制域、去重復、去相似;
步驟2.4:循環執行步驟2.1-2.3,直到所有的URL都被采集和分析后結束。
3.根據權利要求1-2任意一項所述的面向云計算環境的跨站腳本漏洞挖掘方法,其特征在于:步驟5中所述相似性檢測,是采用字符串編輯距離的思想,把一個字符串轉化為另一個字符串的最少操作數;將兩個字符串的距離除以兩個字符串長度的最大值就是相似度。
4.一種面向云計算環境的跨站腳本漏洞挖掘方法,其特征在于:包括網頁爬行模塊、HTML解析模塊、外部JavaScript鏈接提取器模塊、腳本提取器模塊、XSS漏洞判斷模塊;
所述網頁爬行模塊,用于抓取HTTP協議的Web頁面;其中,通過遍歷URL鏈接中的Web站點,且這些Web站點支持并遵循HTTP協議,自動的抽取Web站點層次結構,同時把URL鏈接增加到Web的層次結構中,找到含有參數的Web頁面;
所述HTML解析模塊,用于對網頁爬行模塊抓取的Web頁面進行解析,以獲取Web頁面對應的DOM樹;同時,提取Web頁面中的嵌入式的URL鏈接及調用參數;
所述外部JavaScript鏈接提取器模塊,用于根據URL鏈接及調用參數,檢索對應的外部JavaScript文件,從而獲取請求鏈接中的相關腳本集;
所述腳本提取器模塊,用于檢索服務器返回的HTTP響應消息,從而獲取響應信息中的相關腳本集;
所述XSS漏洞判斷模塊,用于根據獲取到的響應信息中的腳本集和從URL鏈接中檢索到的腳本內容進行相似性檢測;通過是否檢測到相似性來判斷是否存在XSS漏洞;
所述XSS漏洞判斷模塊包括虛擬解碼器模塊、相似性檢測器模塊;
所述虛擬解碼器模塊,用于對獲取到的HTTP響應消息中的腳本集和從URL鏈接中檢索到的請求信息中的腳本集執行遞歸解碼,直到兩者中的所有JS字符串都將以可讀形式進行轉換;
所述相似性檢測器模塊,用于對解碼后的響應腳本集內容和請求腳本集內容,檢測字符串之間是否存在任何相似性;若在這兩組腳本之間檢測到任何相似性,則證明有XSS漏洞在。
5.根據權利要求4所述的面向云計算環境的跨站腳本漏洞挖掘系統,其特征在于:所述外部JavaScript鏈接提取器模塊包括下載器、解析器和URL處理器;
所述下載器,用于下載網站的HTML頁面內容,傳給解析器;
所述解析器,用于將HTML內容進行解析,抓取其中的URL,傳給URL處理器;
所述URL處理器,用于對抓取到的URL鏈接進行處理,包括限制域、去重復、去相似,并傳遞給下載器繼續采集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201910933163.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:轉碼器生成方法和裝置、電子設備及存儲介質
- 下一篇:反爬蟲系統及方法





