[發(fā)明專利]一種圖數(shù)據(jù)存取方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201510028305.8 | 申請日: | 2015-01-20 |
| 公開(公告)號: | CN104615677A | 公開(公告)日: | 2015-05-13 |
| 發(fā)明(設計)人: | 劉琴;朱宏明;楊曉雯;周游;張旎 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海光華專利事務所 31219 | 代理人: | 余明偉 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數(shù)據(jù) 存取 方法 系統(tǒng) | ||
技術領域
本發(fā)明涉及一種計算機技術,特別是涉及一種圖數(shù)據(jù)存取方法及系統(tǒng)。
背景技術
圖是計算機科學中最常用的一類抽象數(shù)據(jù)結(jié)構(gòu),在結(jié)構(gòu)和語義方面比線性表和樹更復雜,在數(shù)據(jù)與數(shù)據(jù)關系上更具有一般性表示能力。雖然圖的應用和處理技術已經(jīng)發(fā)展了很長時間,但隨著信息規(guī)模的不斷增長,圖的規(guī)模日益擴大,如何對大規(guī)模圖進行高效處理成為新的挑戰(zhàn)。目前采用云計算環(huán)境進行大規(guī)模圖的存儲和處理具有優(yōu)勢?;谠朴嬎悱h(huán)境的圖存儲系統(tǒng)大致可分為兩種:一種是以GFS、HDFS為代表的分布式文件系統(tǒng);另一種是以BigTable、Hbase為代表的NoSQL分布式數(shù)據(jù)庫。
具體來說,以HDFS為代表的分布式文件系統(tǒng)提供了一個統(tǒng)一的文件系統(tǒng)視圖,并通過將圖頂點、邊數(shù)據(jù)作為文件直接存放。但對圖數(shù)據(jù)的管理依賴于人工或半自動的數(shù)據(jù)管理,雖具有強大的存儲能力,但數(shù)據(jù)管理效率較低。另一方面,NoSQL數(shù)據(jù)庫采用的數(shù)據(jù)模型主要有文檔存儲、列族存儲、Key-Value存儲模型、圖存儲模型。文檔存儲模型與分布式文件系統(tǒng)類似,比較適合存儲系統(tǒng)日志等非結(jié)構(gòu)化數(shù)據(jù),但不太適合以鄰接矩陣、鄰接表組織的圖數(shù)據(jù),其將數(shù)據(jù)作為統(tǒng)一的文檔形式存儲,為支持靈活性導致的處理效率的降低也會成為大規(guī)模圖數(shù)據(jù)管理的性能瓶頸。列族存儲模型比較適合對某一列進行隨機查詢,但是對于窮舉式遍歷,反而不如傳統(tǒng)的面向行的存儲模式。與上述存儲模型相比,Key-Value模型通過將數(shù)據(jù)組織為主鍵-數(shù)據(jù)的映射關系,非常適合通過主鍵進行查詢和遍歷,但對復雜的條件查詢支持度不高。因此,Key-Value模型可很好地支持通過id為條件的單個頂點查詢或圖遍歷操作,但對某個屬性的檢索只能通過全表掃描完成,性能不高。在實際運用中,應用對圖存儲的要求不僅僅局限于對單個節(jié)點的數(shù)據(jù)獲取,而是對圖的拓撲結(jié)構(gòu),如最短路徑、連通性等具有檢索要求,而在這方面Key-Value則不能很好地支持。
最后,圖存儲模型的相關研究還不完善,只有少數(shù)分布式圖數(shù)據(jù)庫如Neo4j等采用了圖存儲模型。這種模型由于其本身的適配性能很好地支持對圖拓撲結(jié)構(gòu)的檢索,但很多時候需要對整個圖做計算才能得出需要的信息,而且這種結(jié)構(gòu)不太好做分布式的集群方案,典型模型如Neo4j不能保持與已有云計算環(huán)境如Hadoop的兼容性,從而不能很好地利用云計算環(huán)境的可擴展性、容錯性等方面的特性。
鑒于此,如何找到一種方法提高對大量圖數(shù)據(jù)信息的存取性能成為了本領域技術人員亟待解決的問題。
發(fā)明內(nèi)容
鑒于以上所述現(xiàn)有技術的缺點,本發(fā)明的目的在于提供一種圖數(shù)據(jù)存取方法及系統(tǒng),用于解決現(xiàn)有技術中在云計算環(huán)境下對圖數(shù)據(jù)的存取性能不高的問題。
為實現(xiàn)上述目的及其他相關目的,本發(fā)明提供一種圖數(shù)據(jù)存取方法,所述圖數(shù)據(jù)存取方法包括:將待存儲的圖數(shù)據(jù)信息分成邊數(shù)據(jù)信息與頂點數(shù)據(jù)信息;其中,所述邊數(shù)據(jù)信息包括邊所連接的頂點標識符;所述頂點數(shù)據(jù)信息包括一個或多個頂點屬性信息,所述頂點屬性信息包括頂點屬性數(shù)據(jù)的定位信息以及頂點屬性解析信息的定位信息,所述頂點屬性數(shù)據(jù)的定位信息用于確定所述頂點屬性數(shù)據(jù)的位置,所述頂點屬性解析信息的定位信息用于確定所述頂點屬性解析信息的位置;所述頂點屬性解析信息用于對所述頂點屬性數(shù)據(jù)進行解析,以獲取所述頂點屬性的值;所述頂點屬性解析信息包括所述頂點屬性的類型以及所述頂點屬性在所述頂點屬性數(shù)據(jù)中的取值方式;分別存儲所述邊數(shù)據(jù)信息與所述頂點數(shù)據(jù)信息。
可選地,所述頂點屬性數(shù)據(jù)的定位信息包括標識符或指針的形式;所述頂點屬性解析信息的定位信息包括標識符或指針的形式。
可選地,所述頂點屬性解析信息還包括分隔符信息,所述頂點屬性數(shù)據(jù)以所述分隔符分割成多個頂點屬性列,所述頂點屬性的取值方式為:在所述頂點屬性在所述頂點屬性數(shù)據(jù)中相應順序的所述頂點屬性列中進行取值;當所述分隔符為空時,所述頂點屬性解析信息包括字節(jié)取值范圍,所述頂點屬性的取值方式為:在所屬頂點屬性數(shù)據(jù)的所述字節(jié)取值范圍中進行取值。
可選地,所述頂點屬性的取值方式還包括對所述頂點屬性數(shù)據(jù)中獲取的值進行進一步解析處理,所述進一步解析處理包括計算平均值。
可選地,所屬頂點屬性解析信息以XML格式定義。
可選地,所述圖數(shù)據(jù)存取方法還包括:讀取所述圖數(shù)據(jù)的邊數(shù)據(jù)信息;通過所述邊數(shù)據(jù)信息的頂點標識符定位所述頂點數(shù)據(jù)信息;讀取所述頂點數(shù)據(jù)信息,根據(jù)所述頂點屬性解析信息對所述頂點屬性數(shù)據(jù)進行解析,獲取所述頂點數(shù)據(jù)信息的頂點屬性值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經(jīng)同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201510028305.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





