[發明專利]一種基于時空密度波與同步的大型時空數據聚類算法GRIDWAVE在審
| 申請號: | 201711063170.4 | 申請日: | 2017-11-02 |
| 公開(公告)號: | CN107704891A | 公開(公告)日: | 2018-02-16 |
| 發明(設計)人: | 鄧超;陳智斌;郭曉惠;農英雄;楊振宇;孫忱;梁東;陸瑛;鐘征燕 | 申請(專利權)人: | 廣西中煙工業有限責任公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京三聚陽光知識產權代理有限公司11250 | 代理人: | 李紅團 |
| 地址: | 530001 廣西壯族*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 時空 密度 同步 大型 數據 算法 gridwave | ||
1.一種基于時空密度波與同步的大型時空數據聚類算法GRIDWAVE,其特征在于,包括以下步驟:
步驟1,根據預設空間邊長L、時序間隔I及D維時空數據集P創建D維時空數據網格G;
步驟2,根據D維時空數據集P中的空間受限變量V、最小近鄰參數MinPts,計算核心空間格子的時空密度波;
步驟3,根據每個核心空間格子的時空密度波及預設時空同步率R計算每一對核心空間格子之間的時空同步率,并根據該所述時空同步率進行無監督的時空網格聚類,并根據數據點所在D維時空格子的聚類結果對整個D維時空數據集P進行分類標注。
2.根據權利要求1所述基于時空密度波與同步的大型時空數據聚類算法GRIDWAVE,其特征在于,步驟1中,所述創建D維時空數據網格G,具體包括:
時序間隔I是大于1的正整數,且空間邊長L大于0,D為正整數;
首先根據所述邊長L對所述D維空間數據集P中的每個空間維度的數值范圍進行平均切分,創建一個D-1維空間數據網格G’,其次根據所述時序間隔I對所述D-1維空間數據網格G’再進行時序切分,創建D維時空數據網格G;
所述D-1維空間數據網格G’中的每個格子為各邊相等的超方格子。
根據所述D維空間數據集P中每個點的D維時空信息將數據點映射到相應的所述D維時空數據網格G中的時空格子,并進行數據點數量累加與記錄。
3.根據權利要求1所述基于時空密度波與同步的大型時空數據聚類算法GRIDWAVE,其特征在于,步驟2中,所述核心空間格子是所述D-1維空間數據網格G’中的格子中數據點數量大于或等于所述最小近鄰參數MinPts的格子,并為每個核心空間格子設置一個獨立的時空類標;
對核心空間格子計算時空密度波,其計算方法為:
1)計算每個核心空間格子中I個時空格子的時空密度值,計算方法為:對所述時空格子中所有數據點所關聯的空間受限變量V進行累加與記錄;
2)第一個時空格子的時空密度波值固定為0,之后的I-1個時空格子的時空密度波值的計算方法為:當本時序時空格子的時空密度值大于上一時序時空格子的時空密度值時,其時空密度波值計為1;當本時序時空格子的時空密度值小于上一時序時空格子的時空密度值時,其時空密度波值計為-1;當本時序時空格子的時空密度值等于上一時序時空格子的時空密度值時,其時空密度波值計為0;
3)所述核心空間格子的時空密度波即為其按時序依次排列的時空格子的時空密度波值的I個數字序列的集合,如{0,1,-1,…,1}。
4.根據權利要求1所述基于時空密度波與同步的大型時空數據聚類算法GRIDWAVE,其特征在于,步驟2中,對每一對所述核心空間格子之間的時空同步性進行計算,計算方法為:
1)比對任意一對核心空間格子在每一個時序中的時空密度波值,當時空密度波值在第In時序中一致時,則認為該2個核心空間格子在第In時序同步;
2)計算任意一對核心空間格子之間的時空相似性,計算方法為:同步時序的數量除以時序總數I;
3)當任意一對所述核心空間格子的時空密度波之間的相似性大于所述時空同步率R,則認為該對核心空間格子為時空同步,將此兩個核心空間格子聚到同一個類中;
4)迭代計算上述過程,直到算法收斂;
5)一個時空類即為具有同樣類標的時空格子或空間格子的最大集合,它表明同一個時空類中的空間格子相互之間關于所述空間受限變量V的時空密度在時序上具有同步性關系。
5.根據權利要求1所述基于時空密度波與同步的大型時空數據聚類算法GRIDWAVE,其特征在于,將所有非空間核心格子均標注為時空噪聲格子。
6.一種執行基于時空密度波與同步的大型時空數據聚類算法GRIDWAVE的電子設備,其特征在于,包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠:
根據預設空間邊長L、時序間隔I及D維時空數據集P創建D維時空數據網格G;
根據D維時空數據集P中的空間受限變量V、最小近鄰參數MinPts,計算核心空間格子的時空密度波;
根據每個核心空間格子的時空密度波及預設時空同步率R計算任意一對核心空間格子之間的時空同步率,并根據該所述時空同步率進行無監督的時空網格聚類,并根據數據點所在D維時空格子的聚類結果對整個D維時空數據集P進行分類標注。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西中煙工業有限責任公司,未經廣西中煙工業有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201711063170.4/1.html,轉載請聲明來源鉆瓜專利網。





