在R SentimentAnalysis软件包中如何计算情感分数?

时间:2018-08-02 19:46:39

标签: r nlp sentiment-analysis sentimentr

我正在使用带有SentimentAnalysis软件包的General Inquirer词典,我不知道他们如何分配情感评分...

例如,如果我运行以下代码:

sentiment <- analyzeSentiment(sampledf)

summary(sentiment$SentimentGI)

我将得到这样的输出:

Min.      1st Qu.   Median     Mean      3rd Qu.     Max. 

-0.80000  -0.16667  -0.07692   -0.07313  0.00000     0.66667

这里使用的秤是多少? -1比1?我不知道如何解释这些结果。

谢谢!

1 个答案:

答案 0 :(得分:1)

所有与情绪相关的分数都是根据公式

计算的
(#positive - #negative) / #all

其中#positive表示肯定单词的数量,#negative表示否定单词的数量,#all表示单词总数。因此,情感分数来自区间[-1,+1]。值0表示文档中的肯定词与否定词一样多。

注意:在实践中,经验均值/中位数值不一定精确地位于零,因为可以感觉到正/负更强或更频繁。因此,人们宁愿选择一个不同的分界点来区分正负。

其他分数如下:

  • 否定性或阳性仅分别计算否定词或肯定词的比率。因此,该值例如由#negative / #all,位于[0,1]中。
  • 极性使用公式(#positive - #negative) / (#positive + #negative)
  • 比率是字典表达式的份额,即(#positive + #negative) / #all