ElasticSearch CJK语言分析器

时间:2015-03-17 11:50:44

标签: elasticsearch

我使用开箱即用的分析器基于ISO 639语言代码索引数据:en,de等。

对于CJK(中文,日文,韩文),基于ISO代码语言,我应该将ja(日语)和ko(韩语)索引到CJK索引中(假设根据文档单独支持中文) ?

1 个答案:

答案 0 :(得分:1)

您可以使用针对中文和日文的单独分析器进行索引编制。对于韩国人,他们还没有添加分析仪。

对于中文,您需要安装smartcn-sentence插件并添加到您的映射中。您可以在smartscn-analyzer

找到smartcn-analyzer

对于日语,您需要安装Kuromoji插件。你可以在Kuromoji-analyzer

找到kuromoji分析仪