[發明專利]數據采樣方法以及數據采樣裝置在審
| 申請號: | 201380030639.8 | 申請日: | 2013-04-01 |
| 公開(公告)號: | CN104350491A | 公開(公告)日: | 2015-02-11 |
| 發明(設計)人: | 劉煥祚;吳鎮午 | 申請(專利權)人: | 浦項工科大學校產學協力團 |
| 主分類號: | G06F17/00 | 分類號: | G06F17/00 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 朱健 |
| 地址: | 韓國慶尚北道*** | 國省代碼: | 韓國;KR |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 采樣 方法 以及 裝置 | ||
技術領域
本發明涉及數據采樣,更加特別地,涉及用于從原始數據采樣用戶期望的數據的數據采樣方法。
背景技術
對于數據處理和數據挖掘而言,采樣是基本技術,并且其主要目的在于在維持原始數據集的特征同時減少目標數據集的大小。以此方式,通過減少目標數據集的大小,由此可減少在不同應用中的計算成本。另外,應用適當的采樣技術可導致諸如數據分析和數據收集應用的性能改進以及成本降低的附加效應,并且可提供罕見類型問題、網絡流量干擾問題等的解決方案。
由于開發在其中不同用戶的興趣被歸納的采樣方法非常困難,采樣方法基于特定問題以及特定用戶興趣被分別地開發。因為缺少針對采樣歸納的框架,研究者們反復實施開發采樣方法并驗證所開發的采樣方法的任務,并且在采樣方法開發過程中的低效致使開發適當的采樣方法變得困難。
發明內容
技術問題
本發明的目的在于提供一種用于獲取反映用戶興趣的采樣結果的數據采樣方法。
本發明的另一目的在于提供一種用于獲取反映用戶興趣的采樣結果的數據采樣裝置。
技術方案
本發明的一方面提供了一種數據采樣方法,其通過數據采樣裝置執行,所述方法包括:基于原始數據,生成反映用戶興趣的興趣模型;以及根據通過將基于原始數據采樣的模型與興趣模型進行比較獲得的結果,確定采樣模型。
此處,生成興趣模型可包括:基于用戶興趣,將包含在原始數據中的元素劃分為多個數據組;根據包含在多個數據組的每個數據組中的至少一個元素與包含在另一數據組中的至少一個元素之間的比例,計算多個數據組的權重;將數據組轉換為根據用戶興趣定義的節點;計算多個節點之間的距離。
此處,確定采樣模型可包括:基于包含在原始數據中的元素,生成多個比較模型;計算興趣模型與多個比較模型之間的距離;以及確定具有在計算得到的距離中滿足預定標準的距離的比較模型作為采樣模型。
此處,生成多個比較模型可包括:將包含在原始數據中的元素劃分為用于興趣模型的多個數據組;基于包含在多個數據組中的至少一個元素,生成多個比較數據組;將比較數據組轉換為根據用戶興趣定義的比較節點;根據包含在多個比較節點的每個比較節點中的至少一個元素與包含在另一比較節點中的至少一個元素之間的比例,計算多個比較節點的權重;計算多個比較節點之間的距離。
本發明的另一方面提供了一種數據采樣裝置,包括:第一生成器,其被配置為,基于原始數據,生成反映用戶興趣的興趣模型;第二生成器,其被配置為,基于包含在原始數據中的元素,生成多個比較模型;確定器,其被配置為,根據通過將興趣模型與多個比較模型進行比較從而獲得的結果,確定采樣模型。
此處,第一生成器可基于用戶興趣將包含在原始數據中的元素劃分為多個數據組,根據包含在多個數據組的每個數據組中的至少一個元素與包含在另一數據組中的至少一個元素之間的比例,計算多個數據組的權重,將數據組轉換為根據用戶興趣定義的節點,以及計算多個節點之間的距離。
此處,第二生成器可將包含在原始數據中的元素劃分為用于興趣模型的多個數據組,基于包含在多個數據組中的至少一個元素,生成多個比較數據組,將比較數據組轉換為根據用戶興趣定義的比較節點,根據包含在多個比較節點的每個比較節點中至少一個元素與包含在另一比較節點中的至少一個元素之間的比例,計算多個比較節點的權重,以及計算多個比較節點之間的距離。
此處,確定器可計算興趣模型和多個比較模型之間的距離,以及確定具有在計算得到的距離中滿足預定標準的距離的比較模型作為采樣模型。
有益效果
根據本發明,興趣模型基于用戶的興趣被生成,以及根據通過將基于原始數據采樣的模型與興趣模型進行比較而獲得的結果,從而確定采樣模型。因此,可以簡單、快速地獲取反映用戶興趣的采樣模型。
附圖說明
圖1為說明根據本發明的具體實施例的數據采樣方法的流程圖。
圖2為說明圖1中生成興趣模型的操作的流程圖。
圖3為說明圖1中確定采樣模型的操作的流程圖。
圖4顯示了通過將原始數據劃分為多個數據組而獲得的結果以及根據所述劃分的采樣結果的坐標圖。
圖5顯示了通過根據本發明的具體實施例的數據采樣方法而生成的興趣模型的概念圖。
圖6顯示了興趣模型(或者比較模型)的實施例的概念圖。
圖7顯示了根據采樣方法的采樣結果的概念圖。
圖8為顯示根據采樣方法的采樣結果與原始數據之間差值的概念圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浦項工科大學校產學協力團,未經浦項工科大學校產學協力團許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201380030639.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種小麥葉蟬的防治方法
- 下一篇:一種十字花科蔬菜病毒病的防治方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





