是否可以修改Lucene 2.2以添加阿拉伯语分析器,如果有人已经这样做了,我在哪里可以获得source / jar
答案 0 :(得分:1)
Lucene 3.0.1有Arabic Analyzer。它位于contrib package。
您可以升级到Lucene 3.0.1,以便开箱即用。由于TokenStream API在此版本中已更改,因此您可能无法像使用Lucene 2.2那样使用它。但是,如果您不希望迁移到最新的Lucene版本,则将2.2的后端更改变为非常困难。
答案 1 :(得分:1)
所以这些非正式地向后移植:http://people.apache.org/~rmuir/
http://people.apache.org/~rmuir/lucene-analyzers-2.4.1_with_arabic_and_farsi.jar http://people.apache.org/~rmuir/arabicFarsiLucene241_contrib.patch http://people.apache.org/~rmuir/arabicFarsiLucene241_core.patch
这意味着您只需要升级到2.4.1,这可能比升级到2.9或3.0更容易。
希望这会有所帮助
答案 2 :(得分:0)
或者,您可以尝试将lucene-hunspell用于分析器。目前正在使用Lucene主干 - 我不知道它是否适用于Lucene 3.0.1。这是Robert Muir's explanation和a list of dictionaries, including Arabic。我相信你也可以支持这个。 Shashikant的建议似乎更容易实现,而这一点可能更好。