tokenize正则表达式

时间:2016-04-11 04:16:59

标签: regex parsing

我在日志中有一个字符串我想要标记。这些字段有时会被' |'标志,有时候是空格。

总是看起来像: 时间戳| log_level |分类| MESSAGE_BODY

timestamp log_level message_body

示例:

2016/04/11 07:05:33 | INFO     | xxc        | message_message_abcde

或者

2016-04-11 07:01:24,895 INFO  message message abcde

我要做的是删除所有重复的邮件(忽略时间戳)。由于我先{gre} log_level = ERROR,我也可以忽略log_level

谢谢!

0 个答案:

没有答案