我正在使用带有SentimentAnalysis软件包的General Inquirer词典,我不知道他们如何分配情感评分...
例如,如果我运行以下代码:
sentiment <- analyzeSentiment(sampledf)
summary(sentiment$SentimentGI)
我将得到这样的输出:
Min. 1st Qu. Median Mean 3rd Qu. Max.
-0.80000 -0.16667 -0.07692 -0.07313 0.00000 0.66667
这里使用的秤是多少? -1比1?我不知道如何解释这些结果。
谢谢!
答案 0 :(得分:1)
所有与情绪相关的分数都是根据公式
计算的(#positive - #negative) / #all
其中#positive
表示肯定单词的数量,#negative
表示否定单词的数量,#all
表示单词总数。因此,情感分数来自区间[-1,+1]。值0
表示文档中的肯定词与否定词一样多。
注意:在实践中,经验均值/中位数值不一定精确地位于零,因为可以感觉到正/负更强或更频繁。因此,人们宁愿选择一个不同的分界点来区分正负。
其他分数如下:
#negative / #all
,位于[0,1]中。 (#positive - #negative) / (#positive + #negative)
。(#positive + #negative) / #all
。