Question

我正在使用带有SentimentAnalysis软件包的General Inquirer词典，我不知道他们如何分配情感评分...

例如，如果我运行以下代码：

sentiment <- analyzeSentiment(sampledf)

summary(sentiment$SentimentGI)

我将得到这样的输出：

Min.      1st Qu.   Median     Mean      3rd Qu.     Max. 

-0.80000  -0.16667  -0.07692   -0.07313  0.00000     0.66667

这里使用的秤是多少？ -1比1？我不知道如何解释这些结果。

谢谢！

Answer 1

所有与情绪相关的分数都是根据公式

计算的

(#positive - #negative) / #all

其中#positive表示肯定单词的数量，#negative表示否定单词的数量，#all表示单词总数。因此，情感分数来自区间[-1，+1]。值0表示文档中的肯定词与否定词一样多。

注意：在实践中，经验均值/中位数值不一定精确地位于零，因为可以感觉到正/负更强或更频繁。因此，人们宁愿选择一个不同的分界点来区分正负。

其他分数如下：