[發(fā)明專利]一種協(xié)議自動(dòng)識(shí)別方法及其所用分類器的構(gòu)造方法在審
| 申請(qǐng)?zhí)枺?/td> | 201310134121.0 | 申請(qǐng)日: | 2013-04-17 |
| 公開(公告)號(hào): | CN104111931A | 公開(公告)日: | 2014-10-22 |
| 發(fā)明(設(shè)計(jì))人: | 楊航;張宇;趙志軍;潘大慶;楊子堯;趙汗青 | 申請(qǐng)(專利權(quán))人: | 中國科學(xué)院聲學(xué)研究所;無錫中科智能信息處理研發(fā)中心有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京法思騰知識(shí)產(chǎn)權(quán)代理有限公司 11318 | 代理人: | 楊小蓉;王敬波 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 協(xié)議 自動(dòng)識(shí)別 方法 及其 所用 分類 構(gòu)造 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及物聯(lián)網(wǎng)領(lǐng)域,特別涉及一種協(xié)議自動(dòng)識(shí)別方法及其所用分類器的構(gòu)造方法。
背景技術(shù)
近年來隨著物聯(lián)網(wǎng)技術(shù)的不斷進(jìn)步,整個(gè)物聯(lián)網(wǎng)產(chǎn)業(yè)進(jìn)入了快速發(fā)展階段,各種新型的面向物聯(lián)網(wǎng)的傳感設(shè)備大量涌現(xiàn),并出現(xiàn)了很多基于這些終端設(shè)備數(shù)據(jù)的創(chuàng)新應(yīng)用。所有物聯(lián)網(wǎng)應(yīng)用的基礎(chǔ)都是在傳感網(wǎng)絡(luò)所收集的數(shù)據(jù),因此數(shù)據(jù)獲取是物聯(lián)網(wǎng)的一個(gè)核心內(nèi)容。
物聯(lián)網(wǎng)發(fā)展十分迅速,相比之下其規(guī)范標(biāo)準(zhǔn)則落后很多。直至目前,仍沒有一個(gè)組織提出的標(biāo)準(zhǔn)能夠被大多數(shù)的從業(yè)人員所認(rèn)同,并且就現(xiàn)下情況來看,這也不是一個(gè)短時(shí)間內(nèi)能夠解決的問題。由此產(chǎn)生的弊端就是數(shù)據(jù)協(xié)議的多樣化和隨意性。傳感數(shù)據(jù)有著各式各樣的協(xié)議格式,并且很多的協(xié)議格式是私有協(xié)議,使用范圍非常窄,這就給讀取并理解傳感數(shù)據(jù)制造了很多的麻煩。
現(xiàn)有技術(shù)中的解決方法可以概括為靜態(tài)綁定模板方法。在該方法中,一個(gè)模板能夠解析一種特定協(xié)議的數(shù)據(jù),將一模板綁定在一個(gè)端口上,則能夠解析該端口接收到的這種協(xié)議的數(shù)據(jù)。但是這樣做的問題在于:一個(gè)端口可能會(huì)接收到不同協(xié)議的數(shù)據(jù)。以網(wǎng)絡(luò)端口為例,各種不同的傳感節(jié)點(diǎn)都可以通過網(wǎng)絡(luò)上傳數(shù)據(jù),這樣在網(wǎng)絡(luò)端口接收到的數(shù)據(jù)往往包含了多種協(xié)議類型。在這種情況下,靜態(tài)綁定的方法不可取。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的靜態(tài)綁定方法無法滿足網(wǎng)絡(luò)數(shù)據(jù)協(xié)議識(shí)別的需要,從而提供一種更加智能、并能動(dòng)態(tài)調(diào)整的協(xié)議自動(dòng)識(shí)別方法。
為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種協(xié)議自動(dòng)識(shí)別中所用分類器的構(gòu)造方法,包括:
步驟11)、采集原始數(shù)據(jù)樣本,從中提取出訓(xùn)練集;其中,
所述訓(xùn)練集中的一個(gè)元素對(duì)應(yīng)原始數(shù)據(jù)樣本中的一個(gè)數(shù)據(jù),每一元素表示為:(x(i),y(i)),其中的y(i)為賦予給第i個(gè)數(shù)據(jù)的類標(biāo),表明該數(shù)據(jù)屬于哪一種協(xié)議;x(i)表示特征值,反映了數(shù)據(jù)的內(nèi)在特性;
步驟12)、利用步驟11)得到的訓(xùn)練集構(gòu)造分類器。
上述技術(shù)方案中,在所述的步驟11)中,通過Tf-Idf方法求取所述特征值;包括:
步驟11-1)、根據(jù)原始數(shù)據(jù)樣本中的數(shù)據(jù)構(gòu)建詞典;所述詞典表示詞匯的取值范圍,所述詞匯表示組成原始數(shù)據(jù)的字符串中若干個(gè)字符的組合;
步驟11-2)、將原始數(shù)據(jù)樣本中的各個(gè)數(shù)據(jù)與步驟11-1)所得到的詞典進(jìn)行比較,根據(jù)比較結(jié)果得到各個(gè)數(shù)據(jù)的特征值。
上述技術(shù)方案中,在所述的步驟11-1)中還包括:計(jì)算所述詞匯與詞典的關(guān)聯(lián)程度,將關(guān)聯(lián)程度低的詞匯從所述詞典中刪除。
上述技術(shù)方案中,在所述的步驟12)中,采用k類樸素貝葉斯方法構(gòu)造分類器。
本發(fā)明還提供了一種基于所述方法所構(gòu)造的分類器實(shí)現(xiàn)協(xié)議自動(dòng)識(shí)別的方法,包括:
步驟21)、接收到數(shù)據(jù)后,提取出該數(shù)據(jù)的特征值;
步驟22)、將步驟21)所得到的某一數(shù)據(jù)的特征值代入所述分類器中,得到該數(shù)據(jù)所屬協(xié)議的類別。
上述技術(shù)方案中,所述步驟22)包括:
步驟22-1)、將步驟21)所得到的某一數(shù)據(jù)的特征值代入分類器中,得到該特征值屬于各個(gè)協(xié)議的概率值;
步驟22-2)、將步驟22-1)所得到的各個(gè)概率值與一用于表示顯著性的閾值進(jìn)行比較,若均小于該閾值,所述數(shù)據(jù)不屬于任何已知協(xié)議,屬于未分類,否則將概率最大值所對(duì)應(yīng)的協(xié)議作為所述數(shù)據(jù)所屬的協(xié)議;
步驟22-3)、對(duì)分類后的數(shù)據(jù)做進(jìn)一步分析,將分析結(jié)果與實(shí)際情況較大的數(shù)據(jù)歸為誤分類。
上述技術(shù)方案中,在所述的步驟22)之后還包括:
步驟23)、記錄并保存屬于誤分類或未分類的數(shù)據(jù),達(dá)到一定量后,將這些數(shù)據(jù)按照權(quán)利要求1-4之一所述方法提取訓(xùn)練集,并與之前的訓(xùn)練集合并,形成新的訓(xùn)練集,進(jìn)而構(gòu)造另一分類器。
上述技術(shù)方案中,在所述的步驟22)之后還包括:
步驟24)、當(dāng)刪除的協(xié)議達(dá)到一定數(shù)量后,修改之前保存的訓(xùn)練集,從中刪除所有屬于刪除協(xié)議的數(shù)據(jù)條目,得到新的訓(xùn)練集,然后按照權(quán)利要求1-4之一所述方法得到新的分類器。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn):
1、不再需要綁定端口和協(xié)議,使得數(shù)據(jù)的處理更加地智能和自動(dòng)化。
2、能夠動(dòng)態(tài)地調(diào)整協(xié)議的數(shù)量,方便添加新增協(xié)議,刪除過時(shí)協(xié)議,更適應(yīng)真實(shí)的物聯(lián)網(wǎng)場景。
附圖說明
圖1是本發(fā)明方法中構(gòu)造分類器過程的流程圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院聲學(xué)研究所;無錫中科智能信息處理研發(fā)中心有限公司,未經(jīng)中國科學(xué)院聲學(xué)研究所;無錫中科智能信息處理研發(fā)中心有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201310134121.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 圖像診斷裝置、醫(yī)用系統(tǒng)以及協(xié)議管理方法
- 一種自動(dòng)協(xié)議識(shí)別方法及系統(tǒng)
- 客戶端中遞送協(xié)議數(shù)據(jù)單元的方法及相關(guān)裝置
- 遠(yuǎn)程通訊系統(tǒng)
- 一種基于可拼裝通信協(xié)議棧的通信方法及系統(tǒng)
- 一種實(shí)現(xiàn)國產(chǎn)平臺(tái)PXEBOOT的協(xié)議架構(gòu)
- CBTC通信系統(tǒng)協(xié)議解析方法、協(xié)議庫管理方法
- 一種協(xié)議轉(zhuǎn)換的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于燈光控制的協(xié)議轉(zhuǎn)換系統(tǒng)及方法
- 一種通用工藝人工智能物聯(lián)網(wǎng)網(wǎng)關(guān)
- 在帶有圖像輸入單元的便攜式終端中識(shí)別字符的方法
- 基于無線射頻RFID的檔案管理系統(tǒng)
- 一種防盜監(jiān)控系統(tǒng)的自動(dòng)識(shí)別控制設(shè)備
- 一種基于視頻識(shí)別的隧道運(yùn)行安全事件檢測(cè)系統(tǒng)
- 存儲(chǔ)擴(kuò)充裝置自動(dòng)識(shí)別系統(tǒng)及存儲(chǔ)擴(kuò)充裝置自動(dòng)識(shí)別配置方法
- 快遞物流件自動(dòng)識(shí)別分揀系統(tǒng)
- 一種基于無線技術(shù)的低功耗自動(dòng)識(shí)別終端設(shè)計(jì)方法
- 一種火車車輛、車號(hào)自動(dòng)識(shí)別裝置
- 一種火車車輛、車號(hào)自動(dòng)識(shí)別裝置及其使用方法
- 一種電商用條碼自動(dòng)識(shí)別裝置
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





