推文的R情绪分析得分

时间:2014-11-27 12:30:52

标签: r statistics analytics sentiment-analysis

我正在尝试对Twitter数据集执行情绪分析。为此,我使用的是正面和负面的词典。我想要的是下面的推文

电影星际调查员非常棒!

正面词典:好2真棒5

否定词典:坏-2 - 疯狂-3

因此,推文的分数应为= -3(疯狂)+ 5(真棒)= 2

我已经能够将我的数据集与这些字典相匹配,以创建一个如下所示的posMatch变量:posMatches< - match(words,afinn_list $ word)

posMatches NA NA NA NA 1104 NA NA NA NA NA NA NA NA NA NA NA NA 1836 NA现在我知道哪个位置包含匹配项。在上面的例子中我需要帮助来说明位置1104和1836的重量总和

1 个答案:

答案 0 :(得分:1)

您需要的是总结posMatches不考虑NAs:

 sum(posMatches, na.rm = TRUE)