Lucene 2.2阿拉伯分析仪

时间:2010-05-30 12:18:49

标签: lucene arabic analyzer

是否可以修改Lucene 2.2以添加阿拉伯语分析器,如果有人已经这样做了,我在哪里可以获得source / jar

3 个答案:

答案 0 :(得分:1)

Lucene 3.0.1有Arabic Analyzer。它位于contrib package

您可以升级到Lucene 3.0.1,以便开箱即用。由于TokenStream API在此版本中已更改,因此您可能无法像使用Lucene 2.2那样使用它。但是,如果您不希望迁移到最新的Lucene版本,则将2.2的后端更改变为非常困难。

答案 1 :(得分:1)

有人问我之前如何获得lucene 2.4的阿拉伯语和波斯语支持​​

所以这些非正式地向后移植:http://people.apache.org/~rmuir/

http://people.apache.org/~rmuir/lucene-analyzers-2.4.1_with_arabic_and_farsi.jar http://people.apache.org/~rmuir/arabicFarsiLucene241_contrib.patch http://people.apache.org/~rmuir/arabicFarsiLucene241_core.patch

这意味着您只需要升级到2.4.1,这可能比升级到2.9或3.0更容易。

希望这会有所帮助

答案 2 :(得分:0)

或者,您可以尝试将lucene-hunspell用于分析器。目前正在使用Lucene主干 - 我不知道它是否适用于Lucene 3.0.1。这是Robert Muir's explanationa list of dictionaries, including Arabic。我相信你也可以支持这个。 Shashikant的建议似乎更容易实现,而这一点可能更好。