[發明專利]規則抽取方法和規則抽取設備在審
| 申請號: | 201610258496.1 | 申請日: | 2016-04-22 |
| 公開(公告)號: | CN107305638A | 公開(公告)日: | 2017-10-31 |
| 發明(設計)人: | 楊振華;鐘朝亮;孫俊 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京集佳知識產權代理有限公司11227 | 代理人: | 康建峰,吳瓊 |
| 地址: | 日本神*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 規則 抽取 方法 設備 | ||
技術領域
本發明一般地涉及信息處理領域。具體而言,本發明涉及一種能夠自動地從數據中抽取出可靠性高的規則的方法和設備。
背景技術
近年來,在數據挖掘領域,機器學習的方法得到了蓬勃的發展。但是,從海量的數據中識別潛在的有用的規則(模式)是高度復雜的過程,仍然主要需要人的深入參與。如何利用機器學習實現規則的自動可靠的抽取是面臨的挑戰。
本發明致力于解決上述問題,利用機器學習來處理大量數據、提高處理效率和覆蓋數據的廣度,同時能保證提取出的規則的可靠性。
發明內容
在下文中給出了關于本發明的簡要概述,以便提供關于本發明的某些方面的基本理解。應當理解,這個概述并不是關于本發明的窮舉性概述。它并不是意圖確定本發明的關鍵或重要部分,也不是意圖限定本發明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細描述的前序。
本發明的目的是提出一種自動抽取可靠規則的方法和設備。
為了實現上述目的,根據本發明的一個方面,提供了一種規則抽取方法,該規則抽取方法包括:獲得數據集,所述數據集中包括多組數據,每組數據包括一個或更多個因素值以及對應的一個或更多個目標值;獲取分類器模 型;以及將數據集中的預定數目的訓練用數據集輸入到分類器模型中,以得到規則;其中,所述數據集中的數據與時間相關聯;并且獲得數據集包括將與時間相關聯的數據集轉換為與時間無關聯的數據集。
根據本發明的另一個方面,提供了一種規則抽取設備,該規則抽取設備包括:數據集獲得裝置,被配置為:獲得數據集,所述數據集中包括多組數據,每組數據包括一個或更多個因素值以及對應的一個或更多個目標值;分類器模型構建裝置,被配置為:獲取分類器模型;以及規則獲得裝置,被配置為:將數據集中的預定數目的訓練用數據集輸入到分類器模型中,以得到規則;其中,所述數據集中的數據與時間相關聯;并且所述數據集獲得裝置被進一步配置為:將與時間相關聯的數據集轉換為與時間無關聯的數據集。
另外,根據本發明的另一方面,還提供了一種存儲介質。所述存儲介質包括機器可讀的程序代碼,當在信息處理設備上執行所述程序代碼時,所述程序代碼使得所述信息處理設備執行根據本發明的上述方法。
此外,根據本發明的再一方面,還提供了一種程序產品。所述程序產品包括機器可執行的指令,當在信息處理設備上執行所述指令時,所述指令使得所述信息處理設備執行根據本發明的上述方法。
附圖說明
參照下面結合附圖對本發明的實施例的說明,會更加容易地理解本發明的以上和其它目的、特點和優點。附圖中的部件只是為了示出本發明的原理。在附圖中,相同的或類似的技術特征或部件將采用相同或類似的附圖標記來表示。附圖中:
圖1示出了根據本發明的實施例的規則抽取方法的流程圖。
圖2示出了根據本發明的另一實施例的規則抽取方法的流程圖。
圖3示出了根據本發明的實施例的規則抽取設備的結構方框圖。
圖4示出了可用于實施根據本發明的實施例的方法和設備的計算機的示 意性框圖。
具體實施方式
在下文中將結合附圖對本發明的示范性實施例進行詳細描述。為了清楚和簡明起見,在說明書中并未描述實際實施方式的所有特征。然而,應該了解,在開發任何這種實際實施方式的過程中必須做出很多特定于實施方式的決定,以便實現開發人員的具體目標,例如,符合與系統及業務相關的那些限制條件,并且這些限制條件可能會隨著實施方式的不同而有所改變。此外,還應該了解,雖然開發工作有可能是非常復雜和費時的,但對得益于本公開內容的本領域技術人員來說,這種開發工作僅僅是例行的任務。
在此,還需要說明的一點是,為了避免因不必要的細節而模糊了本發明,在附圖中僅僅示出了與根據本發明的方案密切相關的裝置結構和/或處理步驟,而省略了與本發明關系不大的其他細節。另外,還需要指出的是,在本發明的一個附圖或一種實施方式中描述的元素和特征可以與一個或更多個其它附圖或實施方式中示出的元素和特征相結合。
本發明的基本思想是去除數據的時間相關性并提高距離當前較近的數據的重要性、減少規則涉及因素值的種類以控制規則的數量、多個分類器組合以提高可靠性、正交表表示以去除冗余和增強規則的完備性。
下面將參照圖1描述根據本發明的實施例的規則抽取方法的流程。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201610258496.1/2.html,轉載請聲明來源鉆瓜專利網。





