[發明專利]一種動態知識圖譜的構建方法在審
| 申請號: | 201910279808.0 | 申請日: | 2019-04-09 |
| 公開(公告)號: | CN110008353A | 公開(公告)日: | 2019-07-12 |
| 發明(設計)人: | 張晶 | 申請(專利權)人: | 福建奇點時空數字科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36 |
| 代理公司: | 北京勁創知識產權代理事務所(普通合伙) 11589 | 代理人: | 陸瀅炎 |
| 地址: | 361000 福建省廈門市軟件園*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖譜 原始數據信息 動態知識 構建 構架 知識更新 更新 存儲 | ||
1.一種動態知識圖譜的構建方法,其特征在于,包括以下步驟;
S1、獲取原始數據信息;
S2、對原始數據信息進行存儲以及處理;
S3、根據處理后的原始數據信息,建立知識圖譜初次構架;
S4、知識圖譜初次構架進行知識更新;
S5、對S4進行多次操作,實現知識圖譜初次構架多次更新;
S6、完成動態知識圖譜的建立;
其中,在S4中,知識更新包括以下步驟:
S101、從網站獲取最新數據信息作為參照實體;
S102、抽取圖譜中的現有實體,作為現有實體;
S103、將參照實體與現有實體進行比對;
S104、如果,在S103中的比對結果顯示無誤,則以參照實體作為最終標準的實體;如果,在S103中的比對結果顯示部分相同,則以參照實體作為最終標準的實體;如果在S103中的比對結果顯示完全不同,則將參照實體與現有實體均發送至服務器,進行人工判斷審核,人工審核后,選出最終標準的實體;
S105、知識圖譜初次構架根據S104中選出的最終標準的實體進行數據信息的更新,以完成知識更新過程。
2.根據權利要求1的動態知識圖譜的構建方法,其特征在于,S1中,原始數據包括:在期刊、論文、專利、百科、詞典作為語料來源而獲取的數據信息,將作為原始數據;在社交網站上的熱門標題以及搜索引擎上的熱搜詞匯為起點進行搜索而獲取的數據信息,將作為原始數據;在以國家官網、企業官網以及其他正規機構的官網上獲取的信息,將作為原始數據;在各個專業、職業的獲取的權威性信息,將作為原始數據。
3.根據權利要求1的動態知識圖譜的構建方法,其特征在于,S2中,原始數據信息的存儲和處理包括數據存儲模塊、模型編輯模塊、并發控制模塊、權限控制模塊、數據驗證模塊和自動構建模塊;
數據存儲模塊,用于存儲結構化數據、半結構化數據和非結構化數據;
模型編輯模塊,用于編輯知識模型的概念、實體、屬性、層次關系以及概念-實體關系;
并發控制模塊,用于在數據庫系統中根據事務隔離級別來對數據進行并發編輯;
權限控制模塊,用于校驗用戶登錄信息,以控制不同編輯層面的權限。
4.根據權利要求1的動態知識圖譜的構建方法,其特征在于,在S101中,按照以下方式抽取實體:
S201、對抓取到的標題先使用命名實體識別,抽取出命名實體;
S202、利用分詞技術,從標題中獲取識別不到的候選實體詞列表;
S203、對候選實體詞進行詞性標注,篩去無實際意義的候選詞匯,然后在百科網站上驗證候選詞是否是實體詞,把實體詞和抽取的命名實體作為參照實體。
5.根據權利要求1的動態知識圖譜的構建方法,其特征在于,在S103中,包括數據驗證處理模塊;數據驗證處理模塊,用于驗證實體的完整性和一致性,并備份和導出數據,以及實現實體識別與實體消歧。
6.根據權利要求1的動態知識圖譜的構建方法,其特征在于,在S2中,數據信息采用圖數據庫進行存儲。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建奇點時空數字科技有限公司,未經福建奇點時空數字科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201910279808.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:實體發現方法及裝置
- 下一篇:一種基于知識圖譜的對外漢語學習內容的構建方法





