看来,进行基本情感分析的最简单,最天真的方法是使用贝叶斯分类器(通过我在SO上找到的内容证实)。任何反驳或其他建议?
答案 0 :(得分:11)
带有一袋单词表示的贝叶斯分类器是最简单的统计方法。通过转向更高级的分类器和要素表示,您可以获得更好的结果,但代价是更复杂。
统计方法不是城里唯一的游戏。更加了解文本结构的基于规则的方法是另一个主要选择。从我所看到的,这些实际上并不像统计方法那样好。
我推荐Manning和Schütze的统计自然语言处理基础第16章,文本分类。
答案 1 :(得分:5)
我想不出更简单,更天真的方式来做情感分析,但你可能会考虑使用支持向量机而不是朴素贝叶斯(在一些机器学习工具包中,这可以是替代品)。看看"Thumbs up? Sentiment Classification using Machine Learning Techniques" by Bo Pang, Lillian Lee, and Shivakumar Vaithyanathan这是关于这些技术的最早的论文之一,并提供了一系列相关技术的准确结果表,其中没有一个比任何技术更复杂(从客户的角度来看)其他人。
答案 2 :(得分:1)
基于Ken提供的答案,还有另一篇论文
“使用具有不同信息源的支持向量机的情感分析”,Tony和Niger,
考虑分配更多功能,而不仅仅是Pang和Lee使用的一些单词。在这里,他们利用wordnet来确定形容词的语义区分,以及文本中对主题的情感接近度,作为SVM的附加特征。它们显示出比先前基于情绪对文本进行分类的尝试更好的结果。