[發明專利]搜索語句擴展方法、裝置以及電子設備在審
| 申請號: | 202110251528.6 | 申請日: | 2021-03-08 |
| 公開(公告)號: | CN113010652A | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 王卓然;岳猛;李科研 | 申請(專利權)人: | 大連云知惠科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F40/30 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 張筱寧 |
| 地址: | 116085 遼寧省大連市大連*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 語句 擴展 方法 裝置 以及 電子設備 | ||
本申請提供了一種搜索語句擴展方法、裝置以及電子設備,涉及計算機技術領域。該方法包括:獲取搜索語句;通過預置模型,從對話記錄數據庫中確定出與搜索語句相關聯的多條歷史搜索語句;對話記錄數據庫中存儲有多個用戶的歷史搜索語句;分別確定多條歷史搜索語句與搜索語句的匹配度;基于匹配度,從多條歷史搜索語句中確定出目標歷史搜索語句;將目標歷史搜索語句標記為搜索語句的擴展語句。本申請實現了搜索語句的擴展。
技術領域
本申請涉及計算機技術領域,具體而言,本申請涉及一種搜索語句擴展方法、裝置以及電子設備。
背景技術
用戶輸入搜索語句后系統自動反饋搜索結果是目前一種常見的搜索方式,而人類的語言豐富多彩,相同的問題往往有多種不同的提問方式,如何基于用戶的搜索語句進行擴展得到以其他提問方式提問的搜索語句一直是人們所關注的。
目前,一種搜索語句的擴展的方案是,將原搜索語句的詞語進行同義詞簡單替換,但是,簡單形式替換得到的擴展語句形式單一,并且可能不符合用戶常規搜索語句的語句習慣,導致系統無法識別擴展語句。
發明內容
本申請的第一方面提供了一種搜索語句擴展的方法,該方法包括:
獲取搜索語句;
通過預置模型,從對話記錄數據庫中確定出與搜索語句相關聯的多條歷史搜索語句;對話記錄數據庫中存儲有多個用戶的歷史搜索語句;
分別確定多條歷史搜索語句與搜索語句的匹配度;
基于匹配度,從多條歷史搜索語句中確定出目標歷史搜索語句;
將目標歷史搜索語句標記為搜索語句的擴展語句。
可選的,通過預置模型,從對話記錄數據庫中確定出與搜索語句相關聯的多條歷史搜索語句,包括:
通過預置模型,基于對話記錄數據庫中各條歷史搜索語句的關鍵詞、各條歷史搜索語句分別與搜索語句的語義相似度中至少一項,確定各條歷史搜索語句與搜索語句之間的第一匹配度;
基于第一匹配度,從對話記錄數據庫中確定出與搜索語句相關聯的多條歷史搜索語句。
可選的,通過預置模型,基于對話記錄數據庫中各條歷史搜索語句的關鍵詞、各條歷史搜索語句分別與搜索語句的語義相似度中至少一項,確定條各歷史搜索語句與搜索語句之間的第一匹配度,包括:
從對話記錄數據庫中確定出與搜索語句屬于同一類別的多條第一歷史搜索語句;
通過預置模型,基于多條第一歷史搜索語句中各條歷史搜索語句的關鍵詞、以及各條歷史搜索語句分別與搜索語句的語義相似度中至少一項,確定各條歷史搜索語句與搜索語句之間的第一匹配度。
可選的,基于第一匹配度,從對話記錄數據庫中確定出與搜索語句相關聯的多條歷史搜索語句,包括:
基于第一匹配度,從對話記錄數據庫中確定出與搜索語句相關聯的第二歷史搜索語句;
從對話記錄數據庫中,確定出答案信息與第二歷史搜索語句的答案信息相似的第三歷史搜索語句;
將第二歷史搜索語句與對應的第三歷史搜索語句作為多條歷史搜索語句。
可選的,分別確定多條歷史搜索語句與搜索語句的匹配度,包括以下任一項:
將多條歷史搜索語句中各條歷史搜索語句的第一匹配度作為對應的匹配度;
基于多條歷史搜索語句中各條歷史搜索語句的關鍵詞、各條歷史搜索語句分別與搜索語句的語義相似度中至少一項,對各條歷史搜索語句進行分類,基于分類結果得到各條歷史搜索語句分別與搜索語句的匹配度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連云知惠科技有限公司,未經大連云知惠科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202110251528.6/2.html,轉載請聲明來源鉆瓜專利網。





