我想从文本中提取重要的术语并创建特定于域的术语集。然后我想要了解这些单词在文本中是如何被正面或负面地使用的。
您是否知道任何可以帮助我完成此任务的开源项目?
编辑:
示例文字:
"Although car is not comfortable, I like the design of it."
从这篇文章中,我想提取类似的东西:
design: positive
comfort(able): negative
答案 0 :(得分:2)
为了解析文本并获得所需的词性,有很多工具包
http://incubator.apache.org/opennlp/
等
查看http://en.wikipedia.org/wiki/Sentiment_analysis关于如何正确或消极地使用单词的想法,如果你的意思是内涵。我不知道有任何坚实的平台可以做到这一点,但也许你可以告诉我们更多关于你的问题的一些想法。
如果缺少一个可以为您执行此操作的工具包,您可能会发现将NP和ADJ链接到它们就足够了。你还需要否定检测。我已经使用了这个ohnlp.sourceforge.net(基于Apache UIMA构建),并且它带有一个中等体面的否定检测算法。