控制ElasticSearch中令牌过滤器的顺序

时间:2012-09-27 19:04:12

标签: search elasticsearch tokenize

尝试控制在ElasticSearch中应用令牌过滤器的顺序。

我从文档中知道首先应用了tokenizer,然后是令牌过滤器,但他们没有提到如何确定令牌过滤器的顺序。

以下是我的分析设置脚本中的YAML片段:

       KeywordNameIndexAnalyzer :
           type : custom
           tokenizer : whitespace
           filter : [my_word_concatenator, keyword_ngram]

我原本认为my_word_concatenator会在keyword_ngram之前应用,但似乎并非如此。任何人都知道如何(或是否)可以控制这些过滤器的顺序?

非常感谢!

1 个答案:

答案 0 :(得分:4)

分析器由标记器组成,可将文本拆分为标记。之后,令牌过滤器按照您配置它们的顺序进入图片,因为您提供了一个数组。如果您有疑问,我建议您查看analyze api,通过它您可以实际测试分析仪的工作方式,而无需索引任何文本。