[發(fā)明專利]一種基于索引詞的分析方法與裝置有效
| 申請?zhí)枺?/td> | 201610509743.0 | 申請日: | 2016-06-30 |
| 公開(公告)號: | CN107562753B | 公開(公告)日: | 2020-04-17 |
| 發(fā)明(設計)人: | 裘鋼 | 申請(專利權)人: | 索意互動(北京)信息技術有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/335;G06F16/338 |
| 代理公司: | 北京中政聯(lián)科專利代理事務所(普通合伙) 11489 | 代理人: | 陳超 |
| 地址: | 100089 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 索引 分析 方法 裝置 | ||
本發(fā)明公開了一種基于索引詞的分析方法和裝置,具體包括:接收用戶輸入的第一檢索條件,根據所述第一檢索條件在索引詞數(shù)據庫進行檢索,生成與所述第一檢索條件相匹配的至少一個第一索引詞;根據所述第一索引詞以及基于該第一索引詞的第一統(tǒng)計數(shù)據生成第一索引詞列表;接收用戶輸入的第二檢索條件,獲取該第二檢索條件的第二統(tǒng)計數(shù)據;第一、三統(tǒng)計數(shù)據包括含有索引詞的文獻的數(shù)量以及相應的文獻列表;基于文獻列表進行邏輯與運算,以獲取滿足所述第一檢索條件和第二檢索條件的第三統(tǒng)計數(shù)據,所述第三統(tǒng)計數(shù)據包括文獻數(shù)量。本發(fā)明基于索引詞以及后臺的文獻列表實現(xiàn)了索引詞的選取以及文獻和技術的統(tǒng)計、分析。
技術領域
本發(fā)明涉及信息搜索與分析技術領域,尤其涉及一種基于索引詞的分析方法與裝置。
背景技術
目前信息搜索方面,尤其是文獻搜索方面,主要有兩個檢索手段,其中一個檢索手段就是將查詢請求中的關鍵詞、分類號、申請人等字段與文獻的標引字段進行匹配,得到檢索結果,這一方面需要對文獻進行深加工,尤其是關鍵詞字段的標引需要進行深度開發(fā);一方面需要信息搜索人員對于關鍵詞有很好的擴展能力。這種檢索方式要求用戶必須輸入需要匹配的字段內容。為了改善這種局限性,現(xiàn)有技術還提出了另一種檢索手段語義檢索,即根據詞條向量表以及查詢請求生成查詢向量,根據詞條向量表以及關鍵詞-文檔矩陣生成文檔向量,計算上述兩個向量的相似度來進行語義檢索,當然也有通過專家建立龐雜的知識本體庫,通過知識本題庫自動擴展出關鍵詞,根據輸入的關鍵詞以及擴展出的關鍵詞生成概念向量,然后計算概念向量和文檔向量的相似度來進行語義檢索。
上述檢索方式中匹配過程均是由系統(tǒng)自動完成,用戶根本無法知道匹配是如何進行的,當然也就無法對匹配過程進行控制,以至于對檢索產生的各種噪聲無能為力。
發(fā)明內容
鑒于上述問題,提出了本發(fā)明以便克服上述問題或者至少部分地解決上述問題。
本發(fā)明提供一種基于索引詞的分析方法,該方法包括:
接收用戶輸入的第一檢索條件,根據所述第一檢索條件在索引詞數(shù)據庫進行檢索,生成與所述第一檢索條件相匹配的至少一個第一索引詞;
根據所述第一索引詞以及基于該第一索引詞的第一統(tǒng)計數(shù)據生成第一索引詞列表,所述第一統(tǒng)計數(shù)據包括含有該第一索引詞的文獻的數(shù)量以及相應的第一文獻列表;
接收用戶輸入的第二檢索條件,獲取該第二檢索條件的第二統(tǒng)計數(shù)據,所述第二統(tǒng)計數(shù)據包括滿足該第二檢索條件的文獻的數(shù)量以及相應的第二文獻列表;
將所述第一文獻列表和所述第二文獻列表進行邏輯與運算,以獲取滿足所述第一檢索條件和第二檢索條件的第三統(tǒng)計數(shù)據,所述第三統(tǒng)計數(shù)據包括文獻數(shù)量。
可選的,該方法還包括:顯示所述第一索引詞以及含有該第一索引詞的文獻的數(shù)量;在每個所述第一索引詞下,顯示所述第二檢索條件以及第三統(tǒng)計數(shù)據中的文獻數(shù)量。
可選的,該方法還包括:
根據用戶對第一統(tǒng)計數(shù)據或者第三統(tǒng)計數(shù)據的觸發(fā)操作,相應根據所述第一統(tǒng)計數(shù)據或者第三統(tǒng)計數(shù)據獲取文獻集。
可選的,該第二檢索條件為一個第二索引詞或者具有邏輯或關系的兩個以上第二索引詞。
可選的,所述第二檢索條件包括統(tǒng)配索引詞,所述統(tǒng)配索引詞對應多個第二索引詞。
可選的,在每個所述第一索引詞下,顯示所述第二檢索條件以及第三統(tǒng)計數(shù)據中的文獻數(shù)量,具體為:
在每個所述第一索引詞下,并列顯示每個第二索引詞以及對應的文獻數(shù)量。
可選的,第二檢索條件為具有邏輯與關系的至少兩個第二索引詞;在每個所述第一索引詞下,顯示所述第二檢索條件以及第三統(tǒng)計數(shù)據中的文獻數(shù)量,具體為:在每個所述第一索引詞下,顯示所述至少兩個第二索引詞以及對應的第三統(tǒng)計數(shù)據中的文獻數(shù)量,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索意互動(北京)信息技術有限公司,未經索意互動(北京)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201610509743.0/2.html,轉載請聲明來源鉆瓜專利網。





