[發(fā)明專利]評論信息確定方法、裝置、服務器及存儲介質有效
| 申請?zhí)枺?/td> | 201710317877.7 | 申請日: | 2017-05-08 |
| 公開(公告)號: | CN107153641B | 公開(公告)日: | 2021-01-12 |
| 發(fā)明(設計)人: | 時迎超;和為;佘俏俏;崔建青;周湘陽;鄭俊強 | 申請(專利權)人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/205 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 評論 信息 確定 方法 裝置 服務器 存儲 介質 | ||
1.一種評論信息確定方法,其特征在于,包括:
獲取評論事件的文本內容,依據(jù)所述文本內容確定所述評論事件的事件標簽;
將確定出的事件標簽和評論圖譜中的評論標簽進行比對,依據(jù)比對結果確定候選評論,所述評論圖譜由其它評論事件以及對應的評論內容生成,所述評論圖譜包含有評論內容以及對應的評論標簽;
對所述候選評論進行篩選,將滿足預設條件的候選評論確定為所述評論事件的評論信息;
其中,所述評論圖譜中的評論標簽由評論內容對應的評論主體和評論觀點,以及該評論內容對應的評論事件得到;
依據(jù)所述文本內容確定所述評論事件的事件標簽包括:
對所述文本內容進行預處理,得到和所述文本內容對應的詞語集合,所述詞語集合中包含有至少兩個詞語;
通過預設學習模型確定所述詞語集合中詞語的權重值,將滿足條件的權重值對應的詞語確定為所述評論事件的事件標簽;
對所述文本內容進行預處理之前,還包括:
在所述文本內容中抽取文本要素,所述文本要素包含至少兩個關鍵詞語;
相應的,在將滿足條件的權重值對應的詞語確定為所述評論事件的事件標簽之后,還包括:
將包含所述事件標簽的文本要素中的其它關鍵詞語也確定為所述評論事件的事件標簽。
2.根據(jù)權利要求1所述的方法,其特征在于,將確定出的事件標簽和評論圖譜中的評論標簽進行比對,依據(jù)比對結果確定候選評論包括:
將確定出的事件標簽和評論圖譜中評論內容對應的評論標簽進行比對,依據(jù)評論標簽命中的事件標簽的數(shù)量的大小,由高到低對所述評論內容進行排序,將排序靠前的評論內容作為候選評論。
3.根據(jù)權利要求2所述的方法,其特征在于,對所述候選評論進行篩選,將滿足預設條件的候選評論確定為所述評論事件的評論信息包括:
將候選評論中的評論標簽和所述評論事件的事件標簽一致且正向的候選評論確定為所述評論事件的評論信息。
4.根據(jù)權利要求2所述的方法,其特征在于,所述評論事件包括新聞事件,相應的,在將滿足預設條件的候選評論確定為所述評論事件的評論信息之后,還包括:
確定所述新聞事件的情感邏輯,依據(jù)所述情感邏輯選擇符合條件的評論信息對所述新聞事件進行評論。
5.根據(jù)權利要求1-4中任一項所述的方法,其特征在于,評論圖譜由其它評論事件以及對應的評論內容生成的過程包括:
通過網(wǎng)絡爬蟲定向抓取并確定評論內容;
通過預設識別模型對所述評論內容進行識別,確定和所述評論內容對應的評論主體和評論觀點;
依據(jù)所述評論主體、所述評論觀點以及所述評論內容對應的評論事件確定所述評論內容對應的評論標簽;
將所述評論內容以及確定出的評論標簽以結構化形式存儲為評論圖譜。
6.一種評論信息確定裝置,其特征在于,包括:
事件標簽確定模塊,用于獲取評論事件的文本內容,依據(jù)所述文本內容確定所述評論事件的事件標簽;
候選評論確定模塊,用于將確定出的事件標簽和評論圖譜中的評論標簽進行比對,依據(jù)比對結果確定候選評論,所述評論圖譜由其它評論事件以及對應的評論內容生成,所述評論圖譜包含有評論內容以及對應的評論標簽;
評論信息確定模塊,用于對所述候選評論進行篩選,將滿足預設條件的候選評論確定為所述評論事件的評論信息;
其中,所述評論圖譜中的評論標簽由評論內容對應的評論主體和評論觀點,以及所述評論內容對應的評論事件得到;
所述事件標簽確定模塊具體用于:
對所述文本內容進行預處理,得到和所述文本內容對應的詞語集合,所述詞語集合中包含有至少兩個詞語;
通過預設學習模型確定所述詞語集合中詞語的權重值,將滿足條件的權重值對應的詞語確定為所述評論事件的事件標簽;
所述事件標簽確定模塊還用于:
在對所述文本內容進行預處理之前,在所述文本內容中抽取文本要素,所述文本要素包含至少兩個關鍵詞語;
在將滿足條件的權重值對應的詞語確定為所述評論事件的事件標簽之后,包含所述事件標簽的文本要素中的其它關鍵詞語也確定為所述評論事件的事件標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201710317877.7/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現(xiàn)方法和信息再現(xiàn)設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





