
论文必看!情感分析得分解读,如何避免误解?
在使用微词云情感分析中,很多用户发现某些负面倾向的文本,它的情感得分却是正数,这让很多人感到困惑。
例如:负面情感倾向,但得分是 3.9,而不是 -3.9 中性评论得分 13.25,但用户以为中性应该是 0
这种情况其实是情感分析算法的计算方式不同造成的。本文将详细解析情感分析如何计算得分,以及为什么负面情感得分不是负数,我会从一下章节进行展开讲解下。
1.情感分析的基本原理
2.情感得分的计算方式
3.负面得分为何是正数?
4.案例解析:如何判断情感倾向?
5.其他计算方式对比
一、情感分析的基本原理
我们先从基础的算法原理来讲起,为下面的分析做好铺垫。
目前常见的情感分析方法包括:
基于情感词典的方法(Sentiment Lexicon-based)
基于机器学习的方法(如 SVM、LSTM)
基于深度学习的方法(如 BERT、Transformer)
我们的微词云情感分析工具采用的是基于情感词典的方法,它的核心原理是:
构建情感词典(如 Hownet、NTUSD)
识别文本中的情感词(如“喜欢”是正向,“糟糕”是负向)
结合程度词、否定词调整情感强度(如“非常好”比“好”得分更高)
累加所有情感词的得分,计算最终情感得分
二、情感得分的计算方式
微词云情感分析工具的计算逻辑如下:
每个正面词、负面词都有固定的情感得分(例如“优秀”+3,“差劲”-3)
所有情感词的得分都是正数,只是负面情感词的得分单独计算
情感倾向判断:
正面得分 ≥ 负面得分的 4 倍 → 正面情感
2 倍 ≤ 正面得分 < 4 倍 → 中性情感
正面得分 < 负面得分的 2 倍 → 负面情感
示例:文本 正面得分 负面得分 情感倾向 A: 这次体验很糟糕,但客服态度不错 5.0 9.0 负面 B: 产品质量极差,完全不能接受 0.5 10.0 负面 C: 有点小问题,但总体还行 8.0 3.0 中性 4. 为什么负面得分是正数?
很多用户的误解是:
认为负面得分应该是 负数,如 -9.0 认为中性情感的得分应该是 0
实际上,负面得分是一个“累计得分”,它表示的是:负面情感的强度(而不是数学上的“负数”) 负面情感得分越高,代表负面情绪越强 正面/负面得分比例决定情感倾向,而不是数值的正负
简单理解:得分=0,并不代表情感中性,而是表示没有情感信息 负面情感=负数的方式 只是另一种表示法,与你的工具计算方式不同,但本质无差异
三、案例解析:如何判断情感倾向?
让我们看一个实际案例:
文本 1:产品质量极差,完全不能接受。正面得分:0.5 负面得分:10.0 正面得分 < 负面得分的 2 倍 → 负面评论
文本 2:这次体验很糟糕,但客服态度还不错。正面得分:5.0 负面得分:9.0 正面得分 < 负面得分的 2 倍 → 负面评论
四、其他计算方式对比
有些情感分析工具会:
采用负数表示负面情感(如 -5.0 代表负面情感) 采用归一化得分,将得分范围限定在 [-1, 1]
微词云工具采用的是“累计情感得分”方式,而不是“正负极性得分”,所以:
负面情感的强度不是用负数表示,而是直接计算负面得分的大小。 这更符合大多数学术研究中的情感分析模型,但对部分用户来说可能不够直观。
如果你希望看到负值表示方式,可以这样转换:原始模式:负面得分 = 9.0 极性模式(手动调整):情感得分 = -9.0
希望这篇文章能帮助你在论文写作时更准确地使用情感分析工具,并清晰地解释情感得分的计算方式!
文章推荐
1.如何挖掘行业专属情感词?一文教你高效构建情感词典
2.文本情感分析中,如何生成专业情感词云图?
3.如何有效分析中文情感强度?
4.rostea情感分析不准?试试这款snowNLP情感分析软件
!