Lucene分析仪

时间:2012-12-24 08:51:27

标签: lucene analyzer

我曾与Lucene合作过索引文件并在其中提供搜索,但是,我的工作是英语,但现在,我有一个库尔德语的项目,库尔德语使用一些阿拉伯语unicode字符和其他几个字符,这是Table of Unicode Characters used in Kurdish-Arabic script

我的问题是如何为这种语言创建Analyzer,或者我可以将阿拉伯分析器用于此目的吗?

2 个答案:

答案 0 :(得分:1)

Lucene有list of other analyzers,包括阿拉伯语。我担心没有人专门针对库尔德人,但也许你可以扩展阿拉伯分析仪以满足你的需求?

请记住,所有这些分析仪都来自主要的Lucene发行版separately

答案 1 :(得分:1)

回答有关如何为新语言创建自定义分析器的问题......“Lucene In Action”一书涵盖了自定义分析器的创建,并且非常详细。您可以“利用”其他分析器中的许多代码,只需更改您需要的代码即可。 Lucene是开源的,非常易于扩展,因此分析这些更改非常容易。