[發明專利]無監督的多目標篇章級情感分類模型訓練方法和裝置有效
| 申請號: | 201911382926.0 | 申請日: | 2019-12-27 |
| 公開(公告)號: | CN111143564B | 公開(公告)日: | 2023-05-23 |
| 發明(設計)人: | 劉昊;何伯磊;肖欣延 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/30;G06F40/289;G06F40/216;G06F18/214;G06F18/241 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 戎鄭華 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 監督 多目標 篇章 情感 分類 模型 訓練 方法 裝置 | ||
本申請公開了無監督的多目標篇章級情感分類模型訓練方法和裝置,涉及NLP領域,方法包括:利用預設的編碼器確定訓練樣本集中每個篇章樣本對應的隱狀態向量,每個篇章樣本具有對應的標注情感概率分布;根據每個篇章樣本中的待評價目標及各待評價目標對應的預設的權重矩陣,計算每個待評價目標對應的注意力值;利用預設的解碼器,對每個篇章樣本對應的隱狀態向量及注意力值進行解碼處理,確定每個待評價目標的情感概率分布,并依此確定每個篇章樣本的預測情感概率分布;根據每個篇章樣本的預測情感概率分布與標注情感概率分布的差異,對預設的編碼器、各預設的權重矩陣及預設的解碼器進行更新?;谄录壍那楦袠俗祿柧毮P停杀镜?,實用性高。
技術領域
本申請涉及計算機技術領域,具體涉及自然語言處理(Natural?LanguageProcessing,NLP)技術領域,尤其涉及一種無監督的多目標篇章級情感分類模型訓練方法和裝置。
背景技術
目前多目標篇章級情感分析方法,多是基于有監督的深度學習實現的。這這種方法需要將標注好的篇章文本中各評價目標的情感極性作為訓練數據進行模型訓練。
但是,由于篇章文本中各評價目標的情感極性標注過程需要大量的人力和物力,從而使得該分析方法的成本太高,實用性較差。
發明內容
本申請提出一種無監督的多目標篇章級情感分類模型訓練方法和裝置,用于解決相關技術中,用于基于有監督的深度學習進行多目標篇章級情感分析,成本較高,實用性差的問題。
本申請一方面實施例提出了一種無監督的多目標篇章級情感分類模型訓練方法,包括:
利用預設的編碼器將訓練樣本集中每個篇章樣本進行編碼處理,確定每個篇章樣本對應的隱狀態向量,其中,所述訓練樣本集中包括多個篇章樣本及每個篇章樣本對應的標注情感概率分布;
根據每個篇章樣本中包括的待評價目標及各待評價目標對應的預設的權重矩陣,計算每個篇章樣本中每個待評價目標對應的注意力值;
利用預設的解碼器,對每個篇章樣本對應的隱狀態向量及每個篇章樣本中每個待評價目標對應的注意力值進行解碼處理,確定每個篇章樣本中每個待評價目標對應的情感概率分布;
根據每個篇章樣本中每個待評價目標對應的情感概率分布,確定每個篇章樣本對應的預測情感概率分布;
根據每個篇章樣本對應的預測情感概率分布與對應的標注情感概率分布的差異,對所述預設的編碼器、各待評價目標對應的預設的權重矩陣及預設的解碼器進行更新。
本申請實施例的無監督的多目標篇章級情感分類模型訓練方法,通過利用預設的編碼器將訓練樣本集中每個篇章樣本進行編碼處理,確定每個篇章樣本對應的隱狀態向量,其中,訓練樣本集中包括多個篇章樣本及每個篇章樣本對應的標注情感概率分布;然后根據每個篇章樣本中包括的待評價目標及各待評價目標對應的預設的權重矩陣,計算每個篇章樣本中每個待評價目標對應的注意力值;之后利用預設的解碼器,對每個篇章樣本對應的隱狀態向量及每個篇章樣本中每個待評價目標對應的注意力值進行解碼處理,確定每個篇章樣本中每個待評價目標對應的情感概率分布;之后根據每個篇章樣本中每個待評價目標對應的情感概率分布,確定每個篇章樣本對應的預測情感概率分布;再根據每個篇章樣本對應的預測情感概率分布與對應的標注情感概率分布的差異,對預設的編碼器、各待評價目標對應的預設的權重矩陣及預設的解碼器進行更新。由此,通過基于篇章級的情感標注數據作為訓練數據,可以訓練得到識別篇章級中各目標的情感極性的模型,無需人工標注各篇章樣本中每個評價目標的情感極性,降低了多目標篇章級情感分類的成本,實用性高。
本申請另一方面實施例提出了一種無監督的多目標篇章級情感分類模型訓練裝置,包括:
第一確定模塊,用于利用預設的編碼器將訓練樣本集中每個篇章樣本進行編碼處理,確定每個篇章樣本對應的隱狀態向量,其中,所述訓練樣本集中包括多個篇章樣本及每個篇章樣本對應的標注情感概率分布;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201911382926.0/2.html,轉載請聲明來源鉆瓜專利網。





