尝试控制在ElasticSearch中应用令牌过滤器的顺序。
我从文档中知道首先应用了tokenizer,然后是令牌过滤器,但他们没有提到如何确定令牌过滤器的顺序。
以下是我的分析设置脚本中的YAML片段:
KeywordNameIndexAnalyzer :
type : custom
tokenizer : whitespace
filter : [my_word_concatenator, keyword_ngram]
我原本认为my_word_concatenator
会在keyword_ngram
之前应用,但似乎并非如此。任何人都知道如何(或是否)可以控制这些过滤器的顺序?
非常感谢!
答案 0 :(得分:4)
分析器由标记器组成,可将文本拆分为标记。之后,令牌过滤器按照您配置它们的顺序进入图片,因为您提供了一个数组。如果您有疑问,我建议您查看analyze api,通过它您可以实际测试分析仪的工作方式,而无需索引任何文本。