我有一堆规则来标记请求。其中大多数适合word_delimiter
过滤器。但我还想指定使用哪些字符来标记请求,例如,
,:
,-
,_
...
我该怎么做?
答案 0 :(得分:0)
通过在自定义分析器中指定字符过滤器,您可以:
在将字符串传递给tokenizer之前对其进行预处理。字符过滤器可用于去除HTML标记,或转换“&”字符“和”:https://www.elastic.co/guide/en/elasticsearch/reference/2.0/analysis-charfilters.html
自定义分析器中的步骤是:
根据https://www.elastic.co/guide/en/elasticsearch/guide/current/custom-analyzers.html
映射字符过滤器应该可以帮助您将指定的字符串预处理到令牌中,其余的分析过程会将其考虑在内