[發明專利]一種基于知識組織的科技信息自動化處理方法及系統在審
| 申請號: | 202010026047.0 | 申請日: | 2020-01-10 |
| 公開(公告)號: | CN111221957A | 公開(公告)日: | 2020-06-02 |
| 發明(設計)人: | 呂鵬輝;衛睿遠;童冉 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G06F16/338 | 分類號: | G06F16/338;G06F16/335;G06F16/35;G06F16/36 |
| 代理公司: | 北京輕創知識產權代理有限公司 11212 | 代理人: | 劉紅陽 |
| 地址: | 230000 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 組織 科技 信息 自動化 處理 方法 系統 | ||
1.一種基于知識組織技術的科技信息自動化處理方法,其特征在于,包括如下步驟:
S1、根據用戶個性化檢索需求自動生成專業信息檢索式,并利用所述專業信息檢索式在互聯網中進行檢索,得到第一數據集,同時在科技數據庫中進行專業檢索,得到第二數據集;
S2、將第一數據集中的所有數據轉換為特定格式的數據,得到第三數據集,合并所述第三數據集和所述第二數據集,得到目標數據集;并對所述目標數據集進行數據去重操作,刪除所述目標大數據集中的重復信息數據;
S3、根據數據文本共現關聯關系,得到所述目標數據集中的任意單個數據與所述目標數據集中其他任意數據間的關聯關系,使每一組單個數據對應的關聯關系的數據形成一個數據組合;
S4、獲取所有的單個數據與所述目標數據集中的其他任意數據的關聯關系并導出得到關系大數據矩陣;
S5、利用所述關系大數據矩陣,聚類分析所述關系大數據矩陣中的所有數據組合,并篩選出相似度超過預定閾值的若干組數據的組合;根據所述關系大數據矩陣,將篩選得到的若干個數據組合可視化,得到所屬領域的科技信息圖譜。
2.根據權利要求1所述一種基于知識組織的科技信息自動化處理方法,其特征在于,在S5步驟中,對于得到的科技信息圖譜,根據具體知識場景進行科學知識可視化輸出,個性化解釋所述技術領域科學圖譜中的每個數據與其他數據的關聯關系。
3.根據權利要求1所述一種基于知識組織的科技信息自動化處理方法,其特征在于,在S1步驟中,所述專業信息檢索式的生成具體步驟為:根據用戶個性化檢索需求,自動利用共詞分析得到若干關鍵字詞;并將所述若干個關鍵字詞進行布爾邏輯組合,得到所述的專業檢索式。
4.根據權利要求1所述一種基于知識組織的科技信息自動化處理方法,其特征在于,在S5步驟中,對于得到的科技信息圖譜,還可以根據預設參數,對所在技術領域內科技信息圖譜的網絡密度、子網權重以及局部空間位置進行調整。
5.根據權利要求1所述一種基于知識組織的科技信息自動化處理方法,其特征在于,在S5步驟中,所述的聚類分析是根據所述關系大數據矩陣以及聚類目的,對所述關系大數據矩陣中所有數據的組合進行的專業探索性分析。
6.一種基于知識組織的科技信息自動化處理系統,其特征在于,包括:科技信息智能檢索模塊、檢索信息結果處理和存儲模塊、科學知識關系組織模塊、關聯關系抽取模塊和可視化表達等模塊;
所述科技信息智能檢索模塊,用于根據用戶個性化檢索需求自動生成專業信息檢索式,并利用專業信息檢索式在互聯網中掃描檢索,得到第一數據集,同時在科技數據庫中進行檢索,得到第二數據集;
所述檢索結果處理和存儲模塊,用于將第一數據集中的所有數據轉換為預定格式大數據,得到第三數據集,合并所述第三數據集和科技信息智能檢索模塊得到第二數據集,合成目標數據集;并對所述目標數據集進行數據去重操作,刪除所述目標數據集中的重復數據信息;
所述科學知識關系組織模塊,用于根據數據文本關聯共現關系,得到檢索結果處理和存儲模塊得到的目標數據集中的任意單個數據與所述目標數據集中其他任意數據間的關聯關系,而每一個單個數據對應的關聯關系大數據形成一個數據組合;
所述關聯關系抽取模塊,用于將科學知識關系組織模塊中所有的單個數據與所述目標數據集中的其他任意數據的關聯關系導出,得到關系大數據矩陣;
所述可視化表達模塊,用于利用關系大數據矩陣,聚類分析所述關系大數據矩陣中所有數據組合,并篩選出相似度超過預定閾值的若干個數據組合;并根據所述關系大數據矩陣,將篩選得到的所述若干個數據組合可視化,得到所屬技術領域的科技信息圖譜。
7.根據權利要求6所述的一種基于知識組織的科技信息自動化處理系統,其特征在于,還包括:科學知識可視化輸出模塊;所述科學知識可視化輸出模塊,用于根據具體知識場景,對于經可視化表達模塊得到的科技信息圖譜進行科學知識可視化輸出,單獨解釋所述技術領域科學圖譜中的每個數據與其他數據間的關聯關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010026047.0/1.html,轉載請聲明來源鉆瓜專利網。





