[發明專利]一種用于建立用戶二元關系庫的方法與設備有效
| 申請號: | 201210592849.3 | 申請日: | 2012-12-31 |
| 公開(公告)號: | CN103064967B | 公開(公告)日: | 2018-10-12 |
| 發明(設計)人: | 陸陽陽;孟可豐 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京漢昊知識產權代理事務所(普通合伙) 11370 | 代理人: | 羅朋;周建華 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 建立 用戶 二元關系 方法 設備 | ||
本發明的目的是提供一種用于建立用戶二元關系庫的方法與設備。其中,處理設備獲取待訓練的用戶語料;對所述用戶語料進行分析處理,以獲得一個或多個候選二元關系對;對所述候選二元關系對進行校驗處理,以獲得校驗后的所述候選二元關系對;根據所述校驗后的候選二元關系對,建立或更新對應用戶的二元關系庫。與現有技術相比,本發明通過對用戶語料進行分析處理所獲得的一個或多個候選二元關系對進行校驗,利用校驗后的候選二元關系對,建立或更新對應用戶的二元關系庫;從而有效地對用戶的二元關系對進行了糾錯,提高了輸入靈活度,與用戶的輸入需求相匹配,還提高了輸入法的輸入效率,改善了用戶體驗。
技術領域
本發明涉及互聯網技術領域,尤其涉及一種用于建立用戶二元關系庫的技術。
背景技術
當前,輸入法中的二元關系庫主要根據基礎詞庫以及用戶自行輸入的一個或多個常用詞生成;然而,根據用戶輸入所生成用戶二元關系庫可能存在錯誤,例如,當用戶多次輸入某個帶有錯別字的詞組時,則可能訓練出帶有該錯誤詞組的用戶二元關系庫,從而導致輸入選項與用戶期望不相符,使得用戶的輸入效率較低。
發明內容
本發明的目的是提供一種用于建立用戶二元關系庫的方法與設備。
根據本發明的一個方面,提供了一種用于建立用戶二元關系庫的方法,其中,該方法包括以下步驟:
a獲取待訓練的用戶語料;
b對所述用戶語料進行分析處理,以獲得一個或多個候選二元關系對;
c對所述候選二元關系對進行校驗處理,以獲得校驗后的所述候選二元關系對;
d根據所述校驗后的候選二元關系對,建立或更新對應用戶的二元關系庫。
根據本發明的另一方面,還提供了一種用于建立用戶二元關系庫的處理設備,其中,該設備包括:
獲取裝置,用于獲取待訓練的用戶語料;
分析裝置,用于對所述用戶語料進行分析處理,以獲得一個或多個候選二元關系對;
校驗裝置,用于對所述候選二元關系對進行校驗處理,以獲得校驗后的所述候選二元關系對;
處理裝置,用于根據所述校驗后的候選二元關系對,建立或更新對應用戶的二元關系庫。
與現有技術相比,本發明通過對用戶語料進行分析處理所獲得的一個或多個候選二元關系對進行校驗,利用校驗后的候選二元關系對,建立或更新對應用戶的二元關系庫;從而有效地對用戶的二元關系對進行了糾錯,提高了輸入靈活度,與用戶的輸入需求相匹配,還提高了輸入法的輸入效率,改善了用戶體驗。
而且,本發明還可以根據預定的二元關系黑名單,對所述候選二元關系對進行校驗處理;進一步地,還可以根據預定的二元關系黑名單,并結合對應的二元關系白名單,對所述候選二元關系對進行校驗處理;更進一步地,還可以根據所述二元關系白名單,對所述二元關系黑名單進行調整處理,并根據所述調整后的二元關系黑名單,對所述候選二元關系對進行校驗處理;從而有效地對用戶的二元關系對進行了糾錯,提高了輸入靈活度,與用戶的輸入需求相匹配,還提高了輸入法的輸入效率,改善了用戶體驗。
而且,本發明還可以根據所述用戶的輸入特征信息,在語料庫或搜索索引庫中匹配查詢,以獲得一個或多個語料結果,以作為所述用戶語料;進一步地,還可以對所述用戶的歷史輸入記錄和/或歷史瀏覽記錄進行分析處理,以獲得所述用戶的輸入特征信息;從而擴大了用戶語料的獲取來源,根據所獲得的更多語料,得到更多的用戶二元關系對,與用戶的輸入需求相匹配,進一步提高用戶的輸入效率,改善了用戶體驗。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201210592849.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:網頁保存、打開方法及裝置
- 下一篇:一種安卓文件的管理方法和裝置





