标签: java internationalization lucene analyzer
哪种lucene分析仪可以用来正确处理日文?它应该能够处理汉字,平假名,片假名,罗马字及其任何组合。
答案 0 :(得分:4)
您应该查看Lucene的contrib域中的CJK包。有一个分析器和一个标记器,专门用于处理中文,日文和韩文。
答案 1 :(得分:3)
我在搜索自己的目的时找到了lucene-gosen:
他们的例子看起来相当不错,但我想这是需要进行大量测试的事情。我也担心他们的向后兼容性政策(或者说完全缺乏一个。)