[發明專利]一種基于知識組織的科技信息自動化處理方法及系統在審
| 申請號: | 202010026047.0 | 申請日: | 2020-01-10 |
| 公開(公告)號: | CN111221957A | 公開(公告)日: | 2020-06-02 |
| 發明(設計)人: | 呂鵬輝;衛睿遠;童冉 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G06F16/338 | 分類號: | G06F16/338;G06F16/335;G06F16/35;G06F16/36 |
| 代理公司: | 北京輕創知識產權代理有限公司 11212 | 代理人: | 劉紅陽 |
| 地址: | 230000 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 組織 科技 信息 自動化 處理 方法 系統 | ||
本發明公開了一種基于知識組織技術的科技信息自動化處理方法,旨在自動完成科學信息檢索、數據處理、聚類及可視化表達等重要環節的專門技術,提高了科技信息的利用效率,降低了科學可視化專業勞動的成本,能夠使科技信息用戶盡快獲得所需的全部相關科技信息以及信息間的相互關聯關系;還增強了科技信息用戶對科技信息掌握的完備性和準確性,提高了科技信息用戶的工作效率和科研效率,擴大了科技信息利用的廣度與深度。另外,本發明一種基于知識組織的科技信息自動化處理系統,可以分為多個模塊分別進行深化處理,具有很強的模塊化特性與技術集成優勢,開發成本低且易于維護。
技術領域
本發明涉及科技大數據以及科技文本信息智能處理的技術領域,具體為一種基于知識組織技術的科技信息自動化處理方法及系統。
背景技術
在互聯網與大數據時代,科學知識生產及其成果生產數量呈爆炸式增長及擴散,這導致科技信息領域后期出現的成果數量以前期成果總數量的數倍且呈指數式增長。人類認知危機逐漸出現在海量科學與技術知識之后,這種危機不僅體現在難以全面掌握學科領域信息,還體現在難以全面認識新興知識領域信息。為了解決這種認知危機,亟須使用數據采集組合技術針對海量科學知識進行自動化獲取與處理,并進行科學知識關系的挖掘以及大數據分析,將得到的結果提供給廣大科技知識用戶,以便科技知識用戶能夠快速查詢并獲取到全部相關科技知識及知識間相互關系,這有利于科技知識的用戶對科學領域相關現有知識進行全面認知與理解。
目前,獲取及挖掘目標專家所在的學科或領域內的科學知識的辦法通常是先人工搜索科學知識,之后鳥瞰式判讀搜索得到的知識并進行人為取舍,最終得到數量有限的目標文獻。在知識成果劇增的時代,這種方式不僅效率低下,而且還使科學信息用戶很難獲得所需的全部相關科技知識,在很大程度上影響了科技信息用戶對相關科技信息掌握的完備性和準確性,嚴重影響科技信息用戶的研究效果與工作效率,同時這種方式不利于擴大科技信息認知與推廣的廣度與深度,其準確性也不能適應人工智能時代海量科技信息的認知需求。因此,開發和使用一種互聯網與大數據環境下的科技信息自動化處理方法與系統成為廣大科技信息用戶的實際和迫切需求。
發明內容
本發明的目的在于:提供一種基于互聯網的科學知識數據自組織和可視化的處理系統與方法,以解決以上技術缺陷。
為了實現上述目的,本發明提供如下技術方案:
一種基于知識組織的科技信息自動化處理方法,包括如下步驟:
S1、根據用戶個性化檢索需求生成專業信息檢索式,并利用所述專業信息檢索式在互聯網中進行檢索,得到第一數據集,同時在科技數據庫中進行檢索,得到第二數據集;
S2、將第一數據集中的所有數據轉換為預定格式的數據,得到第三數據集,合并所述第三數據集和所述第二數據集,得到目標數據集;并對所述目標數據集進行數據去重操作,刪除所述目標數據集中的重復信息數據;
S3、根據數據文本共現關聯關系,得到所述目標數據集中的任意單個數據與所述目標數據集中其他任意數據間的關聯關系,而每一個單個數據對應的關聯關系大數據形成一個數據組合;
S4、將所有的單個數據與所述目標數據集中的其他任意數據的關聯關系導出得到關系大數據矩陣;
S5、利用所述關系大數據矩陣,聚類分析所述關系大數據矩陣中的所有數據組合,并篩選出相似度超過預定閾值的若干個數據組合;根據所述關系大數據矩陣,將篩選得到的若干個數據組合可視化,得到所屬領域的科技信息圖譜。
優選地,在S5步驟中,對于得到的科技信息圖譜,根據具體知識場景進行科學知識可視化輸出,單獨解釋所述技術領域科學圖譜中的每個數據與其他數據的關聯關系。
優選地,在S1步驟中,所述專業信息檢索式的生成具體步驟為:根據用戶個性化檢索需求,利用共詞分析得到若干個關鍵字詞;并將所述若干個關鍵字詞進行布爾邏輯組合,得到所述的專業檢索式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010026047.0/2.html,轉載請聲明來源鉆瓜專利網。





