ElasticSearch中的复合词处理 - 将“splitted”和“joined”两种形式视为相同

时间:2017-01-02 11:22:54

标签: elasticsearch solr lucene

我在我的项目中使用elasticsearch来搜索产品。它工作得很好。目前我面临着复合词的问题,例如“沐浴露”和“沐浴露”,“洗脸”和“洗脸”等。通过“沐浴露”和“沐浴露”进行搜索会产生不同的效果。我需要一个技巧,将关键字的两种形式都视为相同。

是否有任何分析仪或任何其他选项?我不可能收集所有这类复合词并将它们都插入索引中。我需要一个算法解决方案。有没有?请帮忙。

1 个答案:

答案 0 :(得分:0)

我用Elastic Search synonym Token Filter解决了我的问题。它按照我的预期工作,但有一个条件是我需要手动创建同义词词典。 官方文档为here