我正在尝试对Twitter数据集执行情绪分析。为此,我使用的是正面和负面的词典。我想要的是下面的推文
电影星际调查员非常棒!
正面词典:好2真棒5
否定词典:坏-2 - 疯狂-3
因此,推文的分数应为= -3(疯狂)+ 5(真棒)= 2
我已经能够将我的数据集与这些字典相匹配,以创建一个如下所示的posMatch变量:posMatches< - match(words,afinn_list $ word)
posMatches NA NA NA NA 1104 NA NA NA NA NA NA NA NA NA NA NA NA 1836 NA现在我知道哪个位置包含匹配项。在上面的例子中我需要帮助来说明位置1104和1836的重量总和
答案 0 :(得分:1)
您需要的是总结posMatches
不考虑NAs:
sum(posMatches, na.rm = TRUE)