[發明專利]一種將數據寫入內存的方法及裝置有效
| 申請號: | 201610109642.4 | 申請日: | 2016-02-26 |
| 公開(公告)號: | CN107132993B | 公開(公告)日: | 2021-02-02 |
| 發明(設計)人: | 郭建山 | 申請(專利權)人: | 阿里巴巴(中國)有限公司 |
| 主分類號: | G06F3/06 | 分類號: | G06F3/06;G06F16/25 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 310012 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 寫入 內存 方法 裝置 | ||
本發明提供一種將數據寫入內存的方法及裝置,該方法包括:獲取存儲有定長數據和不定長數據的寫入文件;其中,寫入文件中的每條定長數據包括一條源數據的定長數據以及該條源數據的不定長數據的索引信息,寫入文件中的每條不定長數據包括一條源數據的不定長數據;寫入文件中的所有不定長數據連續存儲以及所有定長數據連續存儲;按照字節對齊的方式,從所述寫入文件中讀取所有定長數據,并將讀取的定長數據寫入內存;根據寫入文件中定長數據包含的索引信息,從所述寫入文件中讀取與所述索引信息對應的不定長數據,并將讀取的不定長數據寫入內存。本發明減少了數據讀取和寫入操作的次數,耗時較短、效率較高。
技術領域
本發明涉及數據處理技術領域,尤其涉及一種將數據寫入內存的方法及裝置。
背景技術
目前在很多的應用場景下,如地圖數據庫、學生信息庫、病患信息庫等,在這些信息庫中包括多條源數據,每條源數據包含的數據項數量相同,有些數據項對應的字符串長度在所有的源數據中是固定的(則這種數據項稱為定長數據),有些數據項對應的字符串長度在不同源數據中為可變的。每一條源數據包括多項信息(則這種數據項稱為不定長數據)。以學生信息庫為例:每一條源數據為一個學生的信息,一條源數據包括以下數據項:名字、學號、院系、班級、家庭住址、各科成績;則在該源數據中學號、各科成績均是數值其對應的數值的長度為固定的如一個字節,而班級、名字、院系、家庭住址這些數據項對于不同的學生是不同的,如有些學生的名字為2個漢字,有些學生的名字為3個,甚至還有些學生的名字為4個漢字,因此同樣是名字這個數據項,但是在不同的源數據中其占的字節數是不同的,因此前述班級、名字、院系、家庭住址這些數據項為不定長數據。
現有技術中,在將源數據文件中的源數據加載到內存中,首先需要將源數據文件中的數據存儲至寫入文件中,再從寫入文件中讀取源數據寫入至內存中。目前源數據文件的源數據存儲格式與寫入文件中的源數據存儲結構一致。
目前將源數據文件中的源數據存儲至寫入文件中的過程為:每讀取一條源數據則將該條源數據存儲至寫入文件中,在寫入文件中存儲該條源數據在寫入文件中的偏移、源數據的總長度、源數據中不定長數據的長度、不定長數據以及源數據中的定長數據。
如下表1為源數據文件中源數據的存儲格式:
表1
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴(中國)有限公司,未經阿里巴巴(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201610109642.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種海量數據的處理方法及其裝置
- 下一篇:一種延長可擦寫芯片壽命的方法和裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





