例如,我有这样的日志:
11:22:33 user:abc&game:cde
如果我使用标准标记生成器,则此日志将拆分为:
11 22 33 user abc game cde
但是11:22:33表示时间,我不想拆分它,我想使用自定义标记生成器将其拆分为:
11:22:33 user abc game cde
那么,我应该如何设置标记器?
答案 0 :(得分:0)
您可以使用模式标记生成器来实现这一点。
pattern
类型的标记化程序,可以通过正则表达式将文本灵活地分离为术语
在此处阅读更多内容:https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pattern-tokenizer.html