我首先使用tm包来创建文档术语矩阵和数据语料库。使用SentimentAnalysis包中的analyticsSentiment函数进行情感分析,并使用convertToDirection函数获取情感方向(正/负/负),效果很好。 现在,我想简单了解一下正负指示句子的比率。
目前为止工作:
SApre82015 <- analyzeSentiment(pre82015docs,aggregate = NULL)
SApre82015$SentimentGI
#Show each review's individual sentiment direction (pos/neut/neg)
pre82015$direction <- convertToDirection(SApre82015$SentimentGI)
不起作用:
我使用了SentimentAnalysis软件包中的ruleSentiment函数,该函数预期将输出“定义为\ frac {P-N} {T}的情感比率”,表示得分在0到1之间。
我根据哈佛字典'DictionaryGI'创建了新字典
dic <- DictionaryGI
dict <- SentimentDictionaryBinary(dic$positive, dic$negative)
ruleSentiment(pre82015dtm, dict)
但是,这并没有给我比率得分,而是我在文本中找到的字典中所有单词的列表。
我也尝试过手动计算比率,但是遇到语法错误。
pre82015$ratio[pre82015$direction == 'positive'/pre82015$direction == 'positive'|'negative']
Error: unexpected '==' in "pre82015$ratio[pre82015$direction == 'positive'/pre82015$direction =="
如果有人知道如何解决这两个问题之一,或者知道另一种可能的解决方案,请告诉我。谢谢!