术语提取和情感分析开源项目

时间:2011-04-05 16:27:50

标签: open-source nlp machine-learning

我想从文本中提取重要的术语并创建特定于域的术语集。然后我想要了解这些单词在文本中是如何被正面或负面地使用的。

您是否知道任何可以帮助我完成此任务的开源项目?

编辑:

示例文字:

"Although car is not comfortable, I like the design of it."

从这篇文章中,我想提取类似的东西:

design:        positive
comfort(able): negative

1 个答案:

答案 0 :(得分:2)

为了解析文本并获得所需的词性,有很多工具包

http://incubator.apache.org/opennlp/

http://www.nltk.org/

查看http://en.wikipedia.org/wiki/Sentiment_analysis关于如何正确或消极地使用单词的想法,如果你的意思是内涵。我不知道有任何坚实的平台可以做到这一点,但也许你可以告诉我们更多关于你的问题的一些想法。

如果缺少一个可以为您执行此操作的工具包,您可能会发现将NP和ADJ链接到它们就足够了。你还需要否定检测。我已经使用了这个ohnlp.sourceforge.net(基于Apache UIMA构建),并且它带有一个中等体面的否定检测算法。