[發(fā)明專利]一種基于歐氏距離的高維數(shù)據(jù)準確近鄰快速檢索方法有效
| 申請?zhí)枺?/td> | 201310226758.2 | 申請日: | 2013-06-06 |
| 公開(公告)號: | CN103279551A | 公開(公告)日: | 2013-09-04 |
| 發(fā)明(設計)人: | 陳純;王燦;卜佳俊;朱林;徐斌;吳曉凡;汪識翰 | 申請(專利權(quán))人: | 浙江大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州天正專利事務所有限公司 33201 | 代理人: | 王兵;黃美娟 |
| 地址: | 310027 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 距離 數(shù)據(jù) 準確 近鄰 快速 檢索 方法 | ||
1.一種基于歐氏距離的高維數(shù)據(jù)準確近鄰快速檢索方法,該方法的特征在于基本步驟如下:?
1)將數(shù)據(jù)表示成向量形式,且采用歐式距離表示向量間的相似程度,即?其中向量?d為向量的維度,?表示?兩向量的相似程度;?
2)將高維數(shù)據(jù)嵌入到以均值和方差構(gòu)成的二維空間S中,并采用制高點樹對嵌入后的二維數(shù)據(jù)建立索引,記為index1;?
3)為高維數(shù)據(jù)本身建立采樣近鄰索引,記為index2,該索引的建立可以采用任意近似近鄰索引結(jié)構(gòu),如R樹,KD樹,局部敏感散列;?
4)對于查詢數(shù)據(jù)q,首先通過索引index2進行采樣,獲得閾值T,然后通過索引index1查詢出二維空間S上到q的歐氏距離小于T的數(shù)據(jù)點的集合,最后進行驗證,即遍歷該候選數(shù)據(jù)集合并求出距離q最近的數(shù)據(jù)點。?
2.如權(quán)利要求1所述的檢索方法,其特征在于:所述的步驟2)中所述的索引index1的建立方法如下:?
1)將數(shù)據(jù)點嵌入到以均值和方差構(gòu)成的二維空間S中,具體方法為:若數(shù)據(jù)點為?則嵌入后的點為(μx,σx),其中μx和σx計算方法為?d為向量的維度;?
2)采用制高點樹對嵌入二維空間S后的數(shù)據(jù)集建立索引index1,其中制高點樹是一種適合范圍搜索的二叉樹結(jié)構(gòu),在每個非葉子節(jié)點對數(shù)據(jù)進行劃分,作為劃分依據(jù)的是數(shù)據(jù)點到某一被選擇的制高點的距離,用制高點樹建立的索引能夠查詢到查詢點的歐氏距離小于某個閾值的所有數(shù)據(jù)點。?
3.如權(quán)利要求1所述的檢索方法,其特征在于:所述的步驟4)中所述的近鄰查詢方法如下:?
1)首先進行采樣以獲得閾值T,我們對T的定義如下:若查詢點為q,則通過索引index2查詢q的近似近鄰,并計算出近似近鄰到q?的歐氏距離記為D,則T=D/d,其中T為我們定義的閾值,D為近似近鄰到查詢點q的歐氏距離,d為數(shù)據(jù)維度;?
2)將查詢點q嵌入到二維空間S中,對應的點記為然后通過索引index2查詢所有到?的距離小于閾值T的數(shù)據(jù)點的集合?
3)對于?其對應的原數(shù)據(jù)的集合為Q,遍歷Q中的每個數(shù)據(jù)點,計算其與查詢點q的歐氏距離,從而求得查詢點q的準確最近鄰。?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學,未經(jīng)浙江大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201310226758.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





