[發明專利]生成提問回答對的方法和設備有效
| 申請號: | 201710696739.4 | 申請日: | 2017-08-15 |
| 公開(公告)號: | CN109947905B | 公開(公告)日: | 2023-02-21 |
| 發明(設計)人: | 張姝;楊銘;孫俊 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/2458 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 康建峰;吳瓊 |
| 地址: | 日本神*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 生成 提問 回答 方法 設備 | ||
1.一種生成提問回答對的方法,包括:
從已有提問回答對中,確定回答源自產品說明書的提問回答對;
判斷給定產品的說明書與回答源自產品說明書的提問回答對是否匹配;以及
基于匹配的給定產品的說明書與回答源自產品說明書的提問回答對,生成針對給定產品的提問回答對,
其中,確定步驟包括:
抽取已有提問回答對對應的產品說明書的小標題和正文,
比較所抽取的小標題和正文與已有提問回答對中回答的相似度,和
將高于預定相似度閾值的相似度對應的已有提問回答對確定為回答源自產品說明書的提問回答對,
其中,判斷步驟包括:
判斷給定產品的說明書中的小標題與回答源自產品說明書的提問回答對中的回答是否匹配,作為判斷步驟的判斷結果,
其中,如果該小標題完整出現在該回答中或者該小標題中的所有短語中的至少一部分短語出現在該回答中,則該小標題與該回答匹配,否則該小標題與該回答不匹配,以及
其中,如果該小標題與該回答不匹配,則判斷該小標題下的段落與該回答是否匹配,作為判斷步驟的判斷結果。
2.如權利要求1所述的方法,還包括:
確定給定產品的類別;
選擇與所確定的類別相同的類別的產品的已有提問回答對中出現頻率高于頻率閾值的提問,作為候選提問;
根據與候選提問對應的回答的分布情況,選擇候選回答;
提供候選提問和候選回答,作為用于生成針對給定產品的提問回答對的候選。
3.如權利要求2所述的方法,其中,類別包括:類型、系列、子系列、功能。
4.如權利要求1所述的方法,還包括:
統計已有提問回答對中的詞語的出現頻率;
根據出現頻率,選取關鍵詞語并賦予權重;
根據給定產品的說明書中的各個段落中出現的關鍵詞語的個數及其權重,對各個段落打分;
根據打分情況,選擇分數超過預定分數閾值或分數前M大的段落作為回答,其中M為預定個數;
將所選擇的段落輸入到神經機器翻譯的編碼器,從神經機器翻譯的解碼器中得到對應的提問;
其中,選擇為回答的段落和所得到的提問構成針對給定產品的提問回答對。
5.如權利要求1所述的方法,還包括:基于所生成的提問回答對,構建提問回答對數據庫。
6.一種生成提問回答對的設備,包括:
參考確定裝置,被配置為:從已有提問回答對中,確定回答源自產品說明書的提問回答對;
匹配判斷裝置,被配置為:判斷給定產品的說明書與回答源自產品說明書的提問回答對是否匹配;以及
對生成裝置,被配置為:基于匹配的給定產品的說明書與回答源自產品說明書的提問回答對,生成針對給定產品的提問回答對,
其中,所述參考確定裝置還被配置為:
抽取已有提問回答對對應的產品說明書的小標題和正文,
比較所抽取的小標題和正文與已有提問回答對中回答的相似度,和
將高于預定相似度閾值的相似度對應的已有提問回答對確定為回答源自產品說明書的提問回答對,
其中,所述匹配判斷裝置還被配置為:
判斷給定產品的說明書中的小標題與回答源自產品說明書的提問回答對中的回答是否匹配,作為判斷步驟的判斷結果,
其中,如果該小標題完整出現在該回答中或者該小標題中的所有短語中的至少一部分短語出現在該回答中,則該小標題與該回答匹配,否則該小標題與該回答不匹配,以及
其中,如果該小標題與該回答不匹配,則判斷該小標題下的段落與該回答是否匹配,作為判斷步驟的判斷結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201710696739.4/1.html,轉載請聲明來源鉆瓜專利網。





