[發明專利]面向科技服務的知識圖譜構建方法、裝置、設備及存儲介質在審
| 申請號: | 202010959747.5 | 申請日: | 2020-09-14 |
| 公開(公告)號: | CN112100401A | 公開(公告)日: | 2020-12-18 |
| 發明(設計)人: | 孫圣力;高凌哲;李青山;司華友 | 申請(專利權)人: | 北京大學;南京博雅區塊鏈研究院有限公司;北京國信云服科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F40/295;G06F40/205 |
| 代理公司: | 無錫永樂唯勤專利代理事務所(普通合伙) 32369 | 代理人: | 孫際德 |
| 地址: | 100000*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 科技服務 知識 圖譜 構建 方法 裝置 設備 存儲 介質 | ||
1.一種面向科技服務的知識圖譜構建方法,其特征在于,包括:
獲取結構化的第一科技服務源數據,所述第一科技服務源數據包括若干結構化的第一科技服務數據;
從結構化的第一科技服務數據中抽取出第一科技服務的屬性及屬性值;
獲取非結構化的第二科技服務源數據,所述第二科技服務源數據包括若干非結構化的第二科技服務文本;
基于行業判斷模型及所述第二科技服務文本確定所述第二科技服務所面向的行業;
基于命名實體抽取模型及所述第二科技服務文本抽取出所述第二科技服務涉及的命名實體;
基于關系抽取模型、所述第二科技服務文本及所述第二科技服務涉及的命名實體抽取出各所述命名實體之間的關系;
將所述第一科技服務的屬性及屬性值、所述第二科技服務所面向的行業、所述第二科技服務的命名實體及所述命名實體之間的關系存儲至圖數據庫中以形成知識圖譜。
2.如權利要求1所述的知識圖譜構建方法,其特征在于:
所述行業判斷模型為BERT分類算法模型;
所述基于行業判斷模型及所述第二科技服務文本確定所述第二科技服務所面向的行業包括:
構建BERT分類算法模型;
獲取若干第二科技服務文本的標題文本并將行業標簽加入至各所述標題文本內以形成訓練樣本集,利用訓練樣本集完成對所述BERT分類算法模型的訓練;
將待確定行業的所述第二科技服務文本的標題文本輸入至訓練好的所述BERT分類算法模型,以確定所述第二科技服務面向的行業。
3.如權利要求1所述的知識圖譜構建方法,其特征在于:
所述命名實體抽取模型為BERT-BILSTM-CRF中文命名識別算法模型;
所述基于命名實體抽取模型及所述第二科技服務文本抽取出所述第二科技服務涉及的命名實體包括:
構建BERT-BILSTM-CRF中文命名識別算法模型;
獲取若干第二科技服務文本的描述文本并利用數據標注平臺對各所述描述文本進行BIO標注以形成經標注后的訓練樣本集,利用訓練樣本集完成對所述BERT-BILSTM-CRF中文命名識別算法模型的訓練;
將待確定行業的所述第二科技服務文本的描述文本輸入至訓練好的所述BERT-BILSTM-CRF中文命名識別算法模型,以抽取出所述第二科技服務涉及的命名實體。
4.如權利要求1所述的知識圖譜構建方法,其特征在于:
所述關系抽取模型為BERT關系抽取算法模型;
所述基于關系抽取模型、所述第二科技服務文本及所述第二科技服務涉及的命名實體抽取出各所述命名實體之間的關系;
構建BERT關系抽取算法模型;
獲取若干第二科技服務文本的描述文本并將所述命名實體抽取模型抽取出的各所述描述文本的命名實體加入至各所述描述文本內,并對各所述描述文本中的命名實體之間的關系進行標注以獲得經關系標注的訓練樣本集,利用訓練樣本集完成對所述BERT關系抽取算法模型的訓練;
獲取待抽取關系的第二科技服務文本的描述文本并將所述命名實體抽取模型抽取出的所述描述文本的命名實體加入至所述描述文本內,并將所述描述文本輸入至所述BERT關系抽取算法模型,以抽取出所述第二科技服務涉及的各命名實體之間的關系。
5.如權利要求1所述的知識圖譜構建方法,其特征在于:所述圖據庫為Neo4j圖數據庫。
6.如權利要求1所述的知識圖譜構建方法,其特征在于:所述第一科技服務源數據和所述第二科技服務源數據利用網絡定向爬蟲獲取;
所述第一科技服務源數據為存儲在關系數據庫中的結構化數據,所述第二科技服務源數據為TXT文本、word文本、PDF文本中的一種或多種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學;南京博雅區塊鏈研究院有限公司;北京國信云服科技有限公司,未經北京大學;南京博雅區塊鏈研究院有限公司;北京國信云服科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010959747.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種線結構光光條中心線提取方法
- 下一篇:攪拌車及其驅動方法





