[發明專利]一種基于自然語言的智能搜索方法有效
| 申請號: | 202011548364.5 | 申請日: | 2020-12-24 |
| 公開(公告)號: | CN112487154B | 公開(公告)日: | 2023-03-31 |
| 發明(設計)人: | 楊光;賀珊 | 申請(專利權)人: | 武漢烽火眾智數字技術有限責任公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36 |
| 代理公司: | 北京匯澤知識產權代理有限公司 11228 | 代理人: | 張濤 |
| 地址: | 430074 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自然語言 智能 搜索 方法 | ||
1.一種基于自然語言的智能搜索方法,其特征在于,將與業務有關的搜索意圖進行整理,按照實體、屬性、通用標簽進行分類,預先構建搜索意圖知識圖譜;
所述基于自然語言的智能搜索方法包括:
接收用戶輸入的搜索文本;
識別所述搜索文本中的原始搜索意圖,采用所述搜索意圖知識圖譜對所述原始搜索意圖進行標準化轉換,得到對應的搜索實體作為最終搜索意圖;
識別所述搜索文本中的原始搜索條件,采用所述搜索意圖知識圖譜對所述原始搜索條件進行標準化轉換,將轉換后的搜索條件作為最終搜索條件;
通過場景識別模型識別出所述搜索文本中的搜索場景;
根據所述最終搜索意圖、所述最終搜索條件和所述搜索場景生成搜索動作,傳入搜索引擎進行搜索;
將所述搜索引擎的搜索結果返回給用戶;
所述識別所述搜索文本中的原始搜索條件,包括:
通過命名實體識別模型識別所述搜索文本,記錄其中的屬性名稱與屬性值,作為所述搜索文本的原始搜索條件;
所述采用所述搜索意圖知識圖譜對所述原始搜索條件進行標準化轉換,包括:
針對識別出的每一原始搜索條件,對其中的屬性值進行標準化,以及通過遍歷所述搜索意圖知識圖譜查找其實體目標與其對應的標準化屬性字段,對其中的屬性名稱進行標準化;
所述搜索場景為不同搜索條件之間的組合模式;
所述通過場景識別模型識別出所述搜索文本中的搜索場景,包括:
通過所述場景識別模型識別出所述最終搜索條件中不同搜索條件之間“與”、“或”、“非”以及其間的組合模式,所述場景識別模型為深度學習模型;
所述根據所述最終搜索意圖、所述最終搜索條件和所述搜索場景生成搜索動作,包括:
根據所述搜索場景確定搜索動作模板,根據所述最終搜索意圖中的實體確定搜索數據來源,并依次將所述最終搜索條件中不同搜索條件分別填入所述搜索動作模板中,生成搜索動作。
2.如權利要求1所述的基于自然語言的智能搜索方法,其特征在于,所述識別所述搜索文本中的原始搜索意圖,包括:
通過命名實體識別模型識別所述搜索文本中詞匯實體的類別與邊界,然后進行依存句法分析,從中提取所述搜索文本的主干部分,作為原始搜索意圖。
3.如權利要求2所述的基于自然語言的智能搜索方法,所述命名實體識別模型采用Albert-tiny和BILSTM+CRF進行模型訓練。
4.如權利要求2所述的基于自然語言的智能搜索方法,其特征在于,采用UD_ChineseGSD中文依存句法樹庫進行中文句法依存分析。
5.如權利要求1所述的基于自然語言的智能搜索方法,其特征在于,所述搜索意圖知識圖譜存儲于JanusGraph圖數據庫中。
6.如權利要求1所述的基于自然語言的智能搜索方法,其特征在于,所述搜索引擎為ElasticSearch。
7.一種電子設備,其特征在于,包括處理器和存儲器,所述存儲器上存儲有計算機程序,所述計算機程序被所述處理器執行時,實現權利要求1至6中任一項所述的方法。
8.一種可讀存儲介質,其特征在于,所述可讀存儲介質內存儲有計算機程序,所述計算機程序被處理器執行時,實現權利要求1至6中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢烽火眾智數字技術有限責任公司,未經武漢烽火眾智數字技術有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202011548364.5/1.html,轉載請聲明來源鉆瓜專利網。





