Java Lucene English Stemmer?

时间:2010-01-09 20:24:48

标签: java lucene

我需要帮助使用Java Lucene通过Google App Engine索引和搜索英文文本。到目前为止我找到的唯一解决方案是SnowballAnalyzer(在contrib包中),但它只支持Lucene 3.0,而GAELucene只支持lucene 2.3.1。只是改变罐子并没有真正起作用..

任何人都可以帮我用英语词干表索引我的文字吗?

谢谢!

4 个答案:

答案 0 :(得分:2)

SnowballAnalyzer已经使用Lucene很长一段时间了,包括2.x版本(请参阅2.4.1 API文档中的its entry)。

但是,奇怪的是,它并不是标准Lucene发行版的一部分,即使文档中的 也是如此。你将不得不寻找一个用于2.3.1的contrib包的版本。

编辑:看起来有副本here

答案 1 :(得分:1)

各种公司还出售更为复杂和/或更快速的替代方案,以实现在Snowball解释器中实施的Porter Stemmers。如果你有这方面的需求,发表评论我会详细说明,但我不想被指责不合理的广告,所以我现在就把它留在那里。

答案 2 :(得分:1)

PorterStemFilter位于lucene核心。它可以与StandardAnalyzer一起用于英语词干。

答案 3 :(得分:0)

您可以在Lucene存档中使用lucene-2.3.1.zip或其相邻文件。但是,我不确定GAELucene提供的定制程度。它似乎不接受任意分析器。