对错误进行分类&日志中的警告

时间:2014-10-23 21:16:21

标签: python shell awk grep

我想对日志文件中的错误进行分类。我有很多文件夹(~100),每个文件夹都有一个日志文件。我希望能够解析所有日志文件并根据频率对不同的错误进行分类。日志将具有以下格式

2014-10-22 07:55:02,997 ERROR log_message [optional_stack_trace]

一种方法是首先解析所有具有ERROR的日志语句并将它们放在一个文件中。理想情况下,生成的文件只有log_messages而没有日期&错误字符串。我想我可以在那之后组合相似的字符串。你们有什么感想?任何更干净,更好的方法?

1 个答案:

答案 0 :(得分:0)

你会想要这样的东西(使用GNU awk来获得真正的二维数组):

$ awk '{cnt[$3][$4]++} END{for (err in cnt) for (msg in cnt[err]) print err, msg, cnt[err][msg]}' file1 file2 ...

但由于你没有发布任何样本输入和预期输出,这是一个猜测。