[發明專利]基于形式概念格的分面搜索方法及系統有效
| 申請號: | 201710483747.0 | 申請日: | 2017-06-22 |
| 公開(公告)號: | CN107391584B | 公開(公告)日: | 2020-12-11 |
| 發明(設計)人: | 楊柳;蔣實知;胡志剛;龍軍;白非非 | 申請(專利權)人: | 中南大學 |
| 主分類號: | G06F16/2457 | 分類號: | G06F16/2457 |
| 代理公司: | 長沙朕揚知識產權代理事務所(普通合伙) 43213 | 代理人: | 楊斌 |
| 地址: | 410083 *** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 形式 概念 搜索 方法 系統 | ||
本發明涉及計算機搜索技術領域,公開一種基于形式概念格的分面搜索方法及系統,以基于形式概念分析理論針對原始信息預構造形式概念格,并在形式概念格的基礎上建立索引,從而建立分面搜索系統。本發明方法包括:構造形式概念格,在構造過程中,形式概念格使用偽造屬性fake_attribute初始化最小概念Bottom;在形式概念格中建立葉子概念的索引;在查詢過程中,概念的內涵對應查詢語句,概念的外延對應結果集;在獲取用戶查詢的分面值集后,在所構造的形式概念格中利用葉子概念自底向上匹配包含屬性集的最小內涵以找到與分面值集對應的目標概念,并返回該目標概念所對應的外延。
技術領域
本發明涉及計算機搜索技術領域,尤其涉及一種基于形式概念格的分面搜索方法及系統。
背景技術
分面搜索(Faceted Search)是一種在關鍵詞搜索的基礎上,根據當前搜索結果提供上下文相關的分面信息(Facet Information)的信息檢索技術。用戶可以脫離系統設計人員既定的類別樹,從各種各樣的角度自定義感興趣的類別。在用戶指定某個分面值(Facet Value)后,系統根據該分面值對應的結果集中動態獲取更細化的信息,新的細化結果能夠從多個分面對結果集進行劃分,幫助用戶進一步了解他們感興趣的數據信息。在整個搜索過程中,用戶可以靈活地切換分面值,從而快速獲取相關內容。
形式概念分析(Formal Concept Analysis)理論是一種針對結構化數據進行知識挖掘與分析的方法,被廣泛應用于知識發現、軟件工程等領域。形式概念分析的核心數據結構即為形式概念格,概念格通過哈斯圖(Hasse Diagram)來表示概念與概念之間的層次結構。
目前流行的分面搜索技術主要建立在傳統的關系型數據庫之上,要快速檢索這些內容并提供相應的分面信息是一個亟待解決的難題。
發明內容
本發明目的在于公開一種基于形式概念格的分面搜索方法及系統,以基于形式概念分析理論針對原始信息預構造形式概念格,并在形式概念格的基礎上建立索引,從而建立分面搜索系統。
為實現上述目的,本發明公開了一種基于形式概念格的分面搜索方法,包括:
構造形式概念格,所述形式概念格使用偽造屬性fake_attribute初始化最小概念Bottom,并在每次更新概念格結構時,將輸入對象Obj的屬性集添加到Bottom的內涵中,最后再將fake_attribute剔除得到完整且正確的形式概念格;同時,在形式概念格中增加新對象的過程中,在輸入屬性集Y后,首先獲取Y所唯一對應的標準生成器,如果概念格已有概念的內涵與Y相等,則Y不產生新概念,并將該新對象添加到其相等內涵所關聯概念的外延中,以及將該新對象添加到此概念所有父概念的外延中;如果概念格不存在已有概念的內涵與Y相等,則創建新概念,并根據標準生成器的直接父概念計算新概念的所有候選直接父概念并篩選出真正的直接父概念,然后更新概念之間的父子關系,同時將該新對象添加到新概念所有父概念的外延中;
在所述形式概念格中建立葉子概念的索引,所述葉子概念是指形式概念格中最小概念的直接父概念;
在查詢過程中,概念的內涵對應查詢語句,概念的外延對應結果集;在獲取用戶查詢的分面值集后,在所構造的形式概念格中利用葉子概念自底向上匹配包含屬性集的最小內涵以找到與所述分面值集對應的目標概念,并返回該目標概念所對應的外延。
與上述方法相對應的,本發明還公開一種基于形式概念格的分面搜索系統,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中南大學,未經中南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201710483747.0/2.html,轉載請聲明來源鉆瓜專利網。





