关于文本挖掘的建议/帮助

时间:2013-05-09 09:39:31

标签: lucene text-mining

我需要使用Map-Reduce概念对单个文档进行文本挖掘。

我的一些朋友建议我使用Apache Lucene。

但是在阅读了几篇关于Apache Lucene的文档之后,我发现它只有在我们需要索引文档时才有用。

有人能建议我使用更好的方法吗?

提前谢谢

1 个答案:

答案 0 :(得分:0)

Lucene是一个文档索引和检索框架。当然,人们可以使用索引数据,如关键字搜索,文档相似性等。

如果您对TM感兴趣,请查看OpenNLP和LingPipe。他们拥有100个用于文本挖掘和自然语言处理的库。