标签: lucene text-mining
我需要使用Map-Reduce概念对单个文档进行文本挖掘。
我的一些朋友建议我使用Apache Lucene。
但是在阅读了几篇关于Apache Lucene的文档之后,我发现它只有在我们需要索引文档时才有用。
有人能建议我使用更好的方法吗?
提前谢谢
答案 0 :(得分:0)
Lucene是一个文档索引和检索框架。当然,人们可以使用索引数据,如关键字搜索,文档相似性等。
如果您对TM感兴趣,请查看OpenNLP和LingPipe。他们拥有100个用于文本挖掘和自然语言处理的库。