审查数据情绪分析,重点是提取负面情绪?

时间:2015-12-08 02:33:02

标签: python machine-learning nlp sentiment-analysis

我正在尝试对评论数据集进行情绪分析。因为我更关心在评论中识别(提取)负面情绪(现在没有标记,但我尝试手动标记几百个或使用Alchemy API),如果评论总体中立或积极但部分有负面情绪,我'我希望我的模型更多地将其视为负面评论。有人可以给我建议如何做到这一点?我正在考虑使用词汇/ word2vect与监督(随机森林,SVM)/​​无监督学习模型(Kmeans)。

2 个答案:

答案 0 :(得分:0)

当您注释情绪时,请不要注释“积极”,“否定”和“中立”。相反,将它们标注为“#34;具有否定"或者"没有消极"。那么你的情绪分类只会关注这些特征表明消极情绪的强烈程度,这似乎是你想要的。

答案 1 :(得分:0)

通过使用单词袋方法,您可以赋予否定单词更多的权重。负数默认为-1,正数默认为+1。

library(qdap)
Dict <- key.pol
Dict$y <- ifelse(Dict$y==-1,-3,Dict$y)
# explore on small chat
polarity("Food is good i like it. The delivery is bad",polarity.frame = Dict)$all

enter image description here

尽管有两个肯定的词,但仍然是负面的。