[發明專利]用于問題回答(QA)的對仗學習在審
| 申請號: | 202010064971.8 | 申請日: | 2020-01-20 |
| 公開(公告)號: | CN113139119A | 公開(公告)日: | 2021-07-20 |
| 發明(設計)人: | 公明;楊澤;壽林鈞;姜大昕 | 申請(專利權)人: | 微軟技術許可有限責任公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/332 |
| 代理公司: | 永新專利商標代理有限公司 72002 | 代理人: | 張立達 |
| 地址: | 美國華*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 問題 回答 qa 對仗 學習 | ||
本公開涉及用于問題回答(QA)的對仗學習,并且提出了用于提供對仗訓練數據的方法和裝置。可以從訓練數據集中獲得一個正例,所述正例包括被標記為相關的第一文本和第二文本。可以從搜索日志中提取對仗信息。可以至少基于所述對仗信息來修改所述第一文本。可以將經修改的第一文本和所述第二文本組合成與所述正例對仗的反例,所述經修改的第一文本和所述第二文本在所述反例中被標記為不相關。
背景技術
搜索引擎可以在搜索結果頁面(SERP)中提供針對用戶查詢的搜索結果。傳統的搜索結果包括指向與用戶查詢最相關的web文檔的鏈接。此處, web文檔也可以被稱為例如網頁等。鏈接可以指超鏈接、網址、URL等。為了找到與查詢相關的回答,用戶需要查看搜索結果、點擊web文檔的鏈接、并且瀏覽所呈現的web文檔。近年來,一些web搜索引擎開始提供問題回答(QA:question answering)服務,其也被稱為web QA服務。QA服務提供了一種更高效的信息訪問機制,其從web文檔中提取最相關的文段 (passage),并且直接將文段內容呈現給用戶。例如,如果用戶的查詢具有問題意圖,則web搜索引擎將會從web文檔中提取最相關的文段,并且將該文段放置到SERP中的單獨的QA塊內。文段可以指從對應的web文檔中提取的一個或多個語句、一個或多個段落、摘要等。QA服務越來越受到搜索引擎用戶的歡迎,也正在成為搜索引擎所提供的重要服務。
發明內容
提供本發明內容以便介紹一組概念,這組概念將在以下的具體實施方式中做進一步描述。本發明內容并非旨在標識所保護主題的關鍵特征或必要特征,也不旨在用于限制所保護主題的范圍。
本公開的實施例提出了用于提供對仗訓練數據的方法和裝置。可以從訓練數據集中獲得一個正例,所述正例包括被標記為相關的第一文本和第二文本。可以從搜索日志中提取對仗信息。可以至少基于所述對仗信息來修改所述第一文本。可以將經修改的第一文本和所述第二文本組合成與所述正例對仗的反例,所述經修改的第一文本和所述第二文本在所述反例中被標記為不相關。
應當注意,以上一個或多個方面包括以下詳細描述以及權利要求中具體指出的特征。下面的說明書及附圖詳細提出了所述一個或多個方面的某些說明性特征。這些特征僅僅指示可以實施各個方面的原理的多種方式,并且本公開旨在包括所有這些方面和其等同變換。
附圖說明
以下將結合附圖描述所公開的多個方面,這些附圖被提供用以說明而非限制所公開的多個方面。
圖1示出了示例性的搜索結果頁面。
圖2示出了根據實施例的提供對仗訓練數據的示例性過程。
圖3示出了根據實施例的通過基于web知識的方法(WKM)來提供對仗訓練數據的示例性過程。
圖4示出了根據實施例的候選項提取的示例性過程。
圖5示出了根據實施例的示例性半結構化數據。
圖6示出了根據實施例的通過基于用戶反饋的方法(UFM)來提供對仗訓練數據的示例性過程。
圖7示出了根據實施例的用于提供對仗訓練數據的示例性方法的流程圖。
圖8示出了根據實施例的用于提供對仗訓練數據的示例性裝置。
圖9示出了根據實施例的用于提供對仗訓練數據的示例性裝置。
具體實施方式
現在將參考多種示例性實施方式來討論本公開。應當理解,這些實施方式的討論僅僅用于使得本領域技術人員能夠更好地理解并從而實施本公開的實施例,而并非教導對本公開的范圍的任何限制。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟技術許可有限責任公司,未經微軟技術許可有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010064971.8/2.html,轉載請聲明來源鉆瓜專利網。





