如何在Quanteda中获得文档的情感评分?

时间:2019-12-16 16:27:09

标签: sentiment-analysis quanteda

我是情绪分析的新手。 Quanteda examples显示如何输出正数和负数。我测试了一些文件。输出如下:

案例1

document    negative    positive
file1   28  28
file2   98  71
file3   28  22
file4   37  39
file5   7   36

或以下

案例2

document    negative    positive    neg_positive    neg_negative
file1   28  28  0   1
file2   98  71  0   0
file3   28  22  1   0
file4   37  39  0   1
file5   7   36  0   1

在两种情况下,您能否让我知道如何对file1 .. file5进行评分?是

(#positive-#negative)/ #all in case 1 file2,(71-98)/(71 + 98)=-27/169 =-0.15?

情况2是什么?

非常感谢。

A

1 个答案:

答案 0 :(得分:1)

如果您将neg_positive视为negative,而将neg_negative视为正数,则可以通过组合成对的列来创建索引。这是合理的,因为例如“负阳性”包含诸如“不好”之类的序列。

(rowSums(object[, c("negative", "neg_positive")]) -
    rowSums(object[, c("positive", "neg_negative")])) / rowSums(object) * 100

另一种(更好的)量度是在 2011年。威廉·洛(William Lowe),肯尼斯·贝努瓦(Kenneth Benoit),斯拉瓦·米哈伊洛夫(Slava Mikhaylov)和迈克尔·拉弗(Michael Laver)。 “ Scaling Policy Preferences From Coded Political Texts.”,立法研究季刊26(1,2月):123-155。这是对数(正/负)或

log( rowSums(object[, c("positive", "neg_negative")]) /
     rowSums(object[, c("negative", "neg_positive")]) )