[發明專利]數據分類的方法和裝置有效
| 申請號: | 201710203582.7 | 申請日: | 2017-03-30 |
| 公開(公告)號: | CN107067032B | 公開(公告)日: | 2020-04-07 |
| 發明(設計)人: | 周方超 | 申請(專利權)人: | 東軟集團股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京英創嘉友知識產權代理事務所(普通合伙) 11447 | 代理人: | 張巖龍;魏嘉熹 |
| 地址: | 110179 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 分類 方法 裝置 | ||
本公開涉及一種數據分類的方法和裝置,該方法包括:獲取待分類數據以及已知分類結果的數據分類樣本,根據該數據分類樣本對該待分類數據進行分類得到第一分類結果,獲取該數據分類樣本的第一分類權重和該待分類數據的第二分類權重,根據該第二分類權重得到對應該第一分類結果的第三分類權重和第四分類權重,根據該第三分類權重和該第四分類權重得到目標分類權重,在該目標分類權重和該第一分類權重滿足預設分類終止條件時,確定分類完成。
技術領域
本公開涉及數據處理領域,具體地,涉及一種數據分類的方法和裝置。
背景技術
風能作為最具規模開發潛力的可再生新能源,近年來發展十分迅速,但是,當風力發電機的某些部件發生異常時,使得風力發電機的實際發電量無法達到目標發電量(即風力發電廠給風力發電機下達的發電量),從而造成限功率。
為了解決這種情況,可以通過采集風力發電機的工作數據,并通過已知的限功率數據和非限功率數據對采集的工作數據進行分類,以確定該工作數據是造成限功率的限功率數據還是未造成限功率的非限功率數據,并根據分類結果確定會造成限功率的工作數據,從而調整風力發電機的工作數據,以避免限功率的發生。現有的分類方法包括獲取未確定分類結果的待分類數據以及已知分類結果的數據分類樣本(即限功率數據和非限功率數據),并將數據分類樣本代入SVM(Support Vector Machine,支持向量機)模型中進行訓練得到訓練后的分類模型,通過該訓練后的分類模型對待分類數據進行分類得到初始分類結果,為了提高初始分類結果的準確率,進一步采用TSVM(Transductive Support VectorMachine,直推支持向量機)方法根據預先為該待分類數據設置的分類權重對初始分類結果不斷進行迭代,直至迭代后得到的分類結果對應的目標分類權重滿足預設分類終止條件,從而提高分類結果的準確率。
但是,在對初始分類結果不斷迭代的過程中,當分類結果中一類數據包括的數據的第一數量與另一類數據包括的數據的第二數量相差較大時,會使得即使分類錯誤,該目標分類權重也會滿足預設分類終止條件,例如,若采集到的風力發電機的工作數據共有100個,其中限功率數據包含的數據的第一數量為95個,非限功率數據包含的數據的第二數量為5個,那么即使將該另一類數據全部錯誤劃分到該一類數據中,該數據分類結果的正確率也達到了95%(但實際分類是錯誤的),因此,采用上述分類方式在第一數量和第二數量相差較大時,數據分類結果仍然存在分類錯誤的數據。
發明內容
為克服相關技術中存在的問題,本公開提供一種數據分類的方法和裝置。
根據本公開實施例的第一方面,提供一種數據分類的方法,所述方法包括:獲取待分類數據以及已知分類結果的數據分類樣本;根據所述數據分類樣本對所述待分類數據進行分類得到第一分類結果;獲取所述數據分類樣本的第一分類權重和所述待分類數據的第二分類權重,其中,所述第一分類權重表示所述數據分類樣本的分類結果的置信度,所述第二分類權重表示所述待分類數據的分類結果的置信度;根據所述第二分類權重得到對應所述第一分類結果的第三分類權重和第四分類權重;根據所述第三分類權重和所述第四分類權重得到目標分類權重;在所述目標分類權重和所述第一分類權重滿足預設分類終止條件時,確定分類完成。
可選地,所述第一分類結果包括第一類數據和第二類數據,在所述根據所述第二分類權重得到對應所述第一分類結果的第三分類權重和第四分類權重前,所述方法還包括:獲取所述第一類數據包括的數據的第一數量和所述第二類數據包括的數據的第二數量;計算所述第一數量和所述第二數量之間的和值;所述根據所述第二分類權重得到對應所述第一分類結果的第三分類權重和第四分類權重包括:根據所述和值以及第二分類權重得到所述第一類數據對應的第三分類權重和所述第二類數據對應的第四分類權重。
可選地,所述根據所述和值以及第二分類權重得到所述第一類數據對應的第三分類權重和所述第二類數據對應的第四分類權重包括:
通過以下公式獲取所述第三分類權重:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東軟集團股份有限公司,未經東軟集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201710203582.7/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





