什么lucene分析仪可用于处理日文文本?

时间:2009-10-26 14:06:03

标签: java internationalization lucene analyzer

哪种lucene分析仪可以用来正确处理日文?它应该能够处理汉字,平假名,片假名,罗马字及其任何组合。

2 个答案:

答案 0 :(得分:4)

您应该查看Lucene的contrib域中的CJK包。有一个分析器和一个标记器,专门用于处理中文,日文和韩文。

答案 1 :(得分:3)

我在搜索自己的目的时找到了lucene-gosen

他们的例子看起来相当不错,但我想这是需要进行大量测试的事情。我也担心他们的向后兼容性政策(或者说完全缺乏一个。)