Java文本分析库

时间:2010-09-23 12:33:58

标签: java text analysis text-analysis

我正在寻找一种java驱动的解决方案,以满足分析句子的需求,以记录关键词是正面还是负面使用。

即关键词可能是'cabbages'和句子: -

'我喜欢卷心菜,但不喜欢豌豆'

我想要一种java文本分析器将其记录为正面。 lucene(Hibernate-Search)库可以用于此吗?

有什么想法吗?

3 个答案:

答案 0 :(得分:16)

您正在寻找“情绪分析”。一种可能性是LingPipe,善意link to their competitors also。 Jeff Dalton在his blog中也有很多自然语言处理工具。

答案 1 :(得分:1)

我怀疑有类似的东西。 Lucene绝对不能开箱即用。

如何以可编程方式评估的方式定义“关键词是否被正面或负面使用”?要做到这一点,你必须分析文本的实际含义,这是一个甚至无法解决的AI问题。

我想你可以通过对关键字是否经常接近正面(好,好,好,好)或消极(坏,讨厌,蹩脚,该死)的关键词进行统计分析来解决它。在那里,否定,讽刺和复杂的句子结构将是有问题的。

答案 2 :(得分:0)

看一下基于Lucene构建的Mahout Taste,但是开箱即可添加很多你需要的东西。 (编辑)我应该补充一点,Mahout Taste只是相关的到你要找的东西而不是100%的匹配。