[發(fā)明專利]一種基于自然語言的智能搜索方法有效
| 申請?zhí)枺?/td> | 202011548364.5 | 申請日: | 2020-12-24 |
| 公開(公告)號: | CN112487154B | 公開(公告)日: | 2023-03-31 |
| 發(fā)明(設(shè)計)人: | 楊光;賀珊 | 申請(專利權(quán))人: | 武漢烽火眾智數(shù)字技術(shù)有限責(zé)任公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36 |
| 代理公司: | 北京匯澤知識產(chǎn)權(quán)代理有限公司 11228 | 代理人: | 張濤 |
| 地址: | 430074 湖*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 自然語言 智能 搜索 方法 | ||
本發(fā)明提供一種基于自然語言的智能搜索方法,將與業(yè)務(wù)有關(guān)的搜索意圖進行整理,按照實體、屬性、通用標(biāo)簽進行分類,預(yù)先構(gòu)建搜索意圖知識圖譜,所述方法包括:接收用戶輸入的搜索文本;識別搜索文本中的原始搜索意圖,采用搜索意圖知識圖譜對原始搜索意圖進行標(biāo)準(zhǔn)化轉(zhuǎn)換,得到對應(yīng)的搜索實體作為最終搜索意圖;識別搜索文本中的原始搜索條件,采用搜索意圖知識圖譜對原始搜索條件進行標(biāo)準(zhǔn)化轉(zhuǎn)換,將轉(zhuǎn)換后的搜索條件作為最終搜索條件;通過場景識別模型識別出搜索文本中的搜索場景;根據(jù)最終搜索意圖、最終搜索條件和搜索場景生成搜索動作,傳入搜索引擎進行搜索;將所述搜索引擎的搜索結(jié)果返回給用戶。本發(fā)明能夠提升自然語言搜索的準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及信息搜索技術(shù)領(lǐng)域,特別涉及一種基于自然語言的智能搜索方法、電子設(shè)備及可讀存儲介質(zhì)。
背景技術(shù)
當(dāng)前大多數(shù)信息搜索形式主要分為兩類:一種是需要用戶顯式地指定搜索目標(biāo)和搜索條件完成搜索,該搜索形式雖然能夠明確地指出搜索目標(biāo)與條件,精確地完成整個搜索過程,但是在不同的搜索場景之間相互切換存在困難;另一種是基于用戶給定搜索語句的全文搜索,雖然通過文本檢索的方式避免了搜索場景切換的問題,但是對于搜索條件的識別以及整個搜索意圖的理解上卻存在著一定的偏差。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于自然語言的智能搜索方法、電子設(shè)備及可讀存儲介質(zhì),以解決現(xiàn)有技術(shù)中自然語言搜索中搜索意圖、搜索場景、搜索條件的識別與標(biāo)準(zhǔn)化轉(zhuǎn)換的問題。本發(fā)明是這樣實現(xiàn)的:
為達到上述目的,本發(fā)明提供一種基于自然語言的智能搜索方法,將與業(yè)務(wù)有關(guān)的搜索意圖進行整理,按照實體、屬性、通用標(biāo)簽進行分類,預(yù)先構(gòu)建搜索意圖知識圖譜;
所述基于自然語言的智能搜索方法包括:
接收用戶輸入的搜索文本;
識別所述搜索文本中的原始搜索意圖,采用所述搜索意圖知識圖譜對所述原始搜索意圖進行標(biāo)準(zhǔn)化轉(zhuǎn)換,得到對應(yīng)的搜索實體作為最終搜索意圖;
識別所述搜索文本中的原始搜索條件,采用所述搜索意圖知識圖譜對所述原始搜索條件進行標(biāo)準(zhǔn)化轉(zhuǎn)換,將轉(zhuǎn)換后的搜索條件作為最終搜索條件;
通過場景識別模型識別出所述搜索文本中的搜索場景;
根據(jù)所述最終搜索意圖、所述最終搜索條件和所述搜索場景生成搜索動作,傳入搜索引擎進行搜索;
將所述搜索引擎的搜索結(jié)果返回給用戶。
進一步的,在上述基于自然語言的智能搜索方法中,所述識別所述搜索文本中的原始搜索意圖,包括:
通過命名實體識別模型識別所述搜索文本中詞匯實體的類別與邊界,然后進行依存句法分析,從中提取所述搜索文本的主干部分,作為原始搜索意圖。
進一步的,在上述基于自然語言的智能搜索方法中,所述命名實體識別模型采用Albert-tiny和BILSTM+CRF進行模型訓(xùn)練。
進一步的,在上述基于自然語言的智能搜索方法中,采用UD_ChineseGSD中文依存句法樹庫進行中文句法依存分析。
進一步的,在上述基于自然語言的智能搜索方法中,所述識別所述搜索文本中的原始搜索條件,包括:
通過命名實體識別模型識別所述搜索文本,記錄其中的屬性名稱與屬性值,作為所述搜索文本的原始搜索條件。
進一步的,在上述基于自然語言的智能搜索方法中,所述采用所述搜索意圖知識圖譜對所述原始搜索條件進行標(biāo)準(zhǔn)化轉(zhuǎn)換,包括:
針對識別出的每一原始搜索條件,對其中的屬性值進行標(biāo)準(zhǔn)化,以及通過遍歷所述搜索意圖知識圖譜查找其實體目標(biāo)與其對應(yīng)的標(biāo)準(zhǔn)化屬性字段,對其中的屬性名稱進行標(biāo)準(zhǔn)化。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢烽火眾智數(shù)字技術(shù)有限責(zé)任公司,未經(jīng)武漢烽火眾智數(shù)字技術(shù)有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202011548364.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





