句子级别到文档级别的情绪分析。分析新闻

时间:2015-02-11 11:38:05

标签: stanford-nlp sentiment-analysis

我需要使用Stanford NLP工具对有关特定主题的新闻文章进行情绪分析。

这样的工具只允许基于句子的情感分析,而我想提取关于我的主题的整篇文章的情绪评估。

例如,如果我的主题是Apple,我想知道有关Apple的新闻文章的情绪。

只计算我文章中句子的平均值不会。例如,我可能会有一篇文章说" Apple非常擅长这个,而且这个和那个。虽然谷歌产品因这些原因非常糟糕而且#34;这样的文章会使用句子的平均分数来产生中性分类,而实际上这是一篇关于Apple的非常积极的文章。

另一方面,过滤我的句子只包括含有Apple这个词的那些句子会错过" Apple的产品A的文章非常好。但是,它缺乏以下关键特征:......"。在这种情况下,如果我只使用包含单词Apple的句子,则第二句的效果将会丢失。

是否有解决此类问题的标准方法? Stanford NLP是否是实现目标的错误工具?

1 个答案:

答案 0 :(得分:4)

更新:你可能想要调查一下 http://blog.getprismatic.com/deeper-content-analysis-with-aspects/

这是一个非常活跃的研究领域,所以很难找到一个现成的工具来做到这一点(斯坦福CoreNLP至少没有建立任何东西)。一些指示:研究基于方面的情绪分析。在这种情况下,Apple将是一个“方面”(不是真的,但可以这样建模)。安德鲁麦卡勒姆在麻省大学的团队,刘冰冰的UIC小组,康奈尔大学的NLP小组等人都在解决这个问题。

如果你想快速修复,我建议从提及Apple及其产品的句子中提取情绪;使用coref(查看Stanford CoreNLP中的dcoref注释器),这将增加句子的回忆并解决句子问题,如“但是,它缺乏......”。