elasticsearch自定义标记器不会按时间分割时间:":"

时间:2016-08-04 06:53:47

标签: elasticsearch tokenize

例如,我有这样的日志:

11:22:33 user:abc&game:cde

如果我使用标准标记生成器,则此日志将拆分为:

 11  22   33  user  abc  game  cde

但是11:22:33表示时间,我不想拆分它,我想使用自定义标记生成器将其拆分为:

11:22:33  user abc  game  cde

那么,我应该如何设置标记器?

1 个答案:

答案 0 :(得分:0)

您可以使用模式标记生成器来实现这一点。

pattern类型的标记化程序,可以通过正则表达式将文本灵活地分离为术语

在此处阅读更多内容:https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pattern-tokenizer.html