如何指定用于标记请求的字符?

时间:2016-12-12 08:44:32

标签: elasticsearch tokenize

我有一堆规则来标记请求。其中大多数适合word_delimiter过滤器。但我还想指定使用哪些字符来标记请求,例如,:-_ ...

我该怎么做?

1 个答案:

答案 0 :(得分:0)

通过在自定义分析器中指定字符过滤器,您可以:

  

在将字符串传递给tokenizer之前对其进行预处理。字符过滤器可用于去除HTML标记,或转换“&”字符“和”:https://www.elastic.co/guide/en/elasticsearch/reference/2.0/analysis-charfilters.html

自定义分析器中的步骤是:

  1. 字符过滤器
  2. 断词
  3. 令牌过滤器
  4. 根据https://www.elastic.co/guide/en/elasticsearch/guide/current/custom-analyzers.html

    映射字符过滤器应该可以帮助您将指定的字符串预处理到令牌中,其余的分析过程会将其考虑在内