[發明專利]一種用于彈幕情感分析且基于表情和語氣的情感詞典構建方法在審
| 申請號: | 202010937693.2 | 申請日: | 2020-09-08 |
| 公開(公告)號: | CN112115707A | 公開(公告)日: | 2020-12-22 |
| 發明(設計)人: | 崔宗敏;邱全磊;肖彥;王立華;楊瀟;呂小蕾 | 申請(專利權)人: | 九江學院 |
| 主分類號: | G06F40/242 | 分類號: | G06F40/242;G06F40/279;G06Q50/00 |
| 代理公司: | 南昌新天下專利商標代理有限公司 36115 | 代理人: | 謝德珍 |
| 地址: | 332000 *** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 彈幕 情感 分析 基于 表情 語氣 詞典 構建 方法 | ||
1.一種用于彈幕情感分析且基于表情和語氣的情感詞典構建方法,其特征在于,首先構建傳統情感詞典TD,而后在傳統情感詞典TD上添加構建的表情詞典E與語氣詞典T以獲得新詞典BSET;同時為區分具有相同情感詞的不同彈幕,構建程度詞典DD和否定詞典ND并添加至新詞典BSET中,最后對基于程度詞典DD和否定詞典ND構建的所有情感詞典進行修正,并將修正后的情感值用于彈幕情感分析。
2.根據權利要求1所述的一種用于彈幕情感分析且基于表情和語氣的情感詞典構建方法,其特征在于,具體步驟如下:
(1)構建傳統情感詞典
首先構建傳統情感詞典TD,TD={基礎情感詞典,領域詞典,字段詞典,網絡詞典,程度詞典,否定詞典};
(2)構建表情詞典
表情詞典E由一組表情構成,E具有三個屬性:符號、類別和情感值,令S為E中的符號集合,C為類別的集合,E.V為情感值的集合,s∈S,c∈C,v∈E.V,表情e=(e.s,e.c,e.v),同時,定義e.v∈[-3,3]∩e.v∈N;表情e的情感值計算如下:
首先,而后計算兩個表情之間的相關程度,如公式(1)所示:
公式(1)中,ECD為表情相關度的縮寫,B(e1,e2)表示兩個表情e1和e2一起出現的彈幕數量,B(e1)和B(e2)表示兩個表情單獨出現的彈幕數量;
其次,設置一組正向表情PE和一組負向表情NE,且如公式(2)所示計算表情e的情感傾向EST:
最后,定義低閾值與高閾值且計算表情e的情感值e.v,如公式(3)所示:
(3)構建語氣詞典
語氣詞典T由一組語氣詞構成,T具有語氣詞和情感值兩個屬性,令W為T中的語氣詞集合,T.V為情感值的集合,w∈W,v∈T.V,語氣詞t=(t.w,t.v);同時,定義t.v∈[-3,3]∩t.v∈N;
在傳統情感詞典TD上添加構建表情詞典E與語氣詞典T,得到新詞典BSET;
(4)構建程度詞典和否定詞典
為區分具有相同情感詞的不同彈幕,在新詞典BSET中構建程度詞典DD和否定詞典ND;
(5)對所有情感詞典進行修正
對基于步驟(4)構建的所有情感詞典進行修正,用于彈幕情感分析。
3.根據權利要求2所述的一種用于彈幕情感分析且基于表情和語氣的情感詞典構建方法,其特征在于,步驟(1)中,基礎情感詞典基于BosonNLP情感詞典構建,領域詞典基于SO-PMI算法構建,字段詞典基于字段分類器構建,網絡詞典基于搜狗輸入法詞典構建。
4.根據權利要求2所述的一種用于彈幕情感分析且基于表情和語氣的情感詞典構建方法,其特征在于,步驟(2)中,公式(1)的計算將得到三個結果:①當ECD(e1,e2)>>0時,e1與e2具有相關性,若e1和e2之間存在相關性,則B(e1,e2)>B(e1)與B(e2),同時,ECD(e1,e2)越大,相關性越強;②ECD(e1,e2)<<0時,e1與e2互斥,同時ECD(e1,e2)的較大值顯示兩個表情更加互斥;③當ECD(e1,e2)≈0時,e1與e2獨立,即e1與e2不相關或互斥。
5.根據權利要求2所述的一種用于彈幕情感分析且基于表情和語氣的情感詞典構建方法,其特征在于,步驟(2)中,公式(3)的計算結果:①當e.v>0時,e是積極表情;②當e.v=0時,e是中性表情;③當e.v<0時,e是消極表情。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于九江學院,未經九江學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010937693.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種聚晶金剛石復合片和錨桿鉆頭
- 下一篇:一種施工升降機防墜保險支架





