使用正则表达式解析log4j日志文件

时间:2015-01-22 08:03:44

标签: java regex log4j

我已经创建了一个java应用程序,用于使用正则表达式解析log4j日志文件,该应用程序可以正常运行我在下面显示的日志

1999-11-27 15:49:37,459 [thread-x] ERROR mypackage - Catastrophic system failure

但不适合

2015-01-22 01:52:54,237 [http-bio-80-exec-5] FATAL   TestLog4jServlet - Show FATAL message

我的log4j ConversionPattern在下面给出

log4j.appender.Appender2.layout.ConversionPattern=%d [%t] %-7p %10c{1} - %m%n

任何人都可以告诉我一些解决方案吗

我的代码如下所示

public static void main(String[] args) {
    String regex = "(\\d{4}-\\d{2}-\\d{2}) (\\d{2}:\\d{2}:\\d{2},\\d{3}) \\[(.*)\\] ([^ ]*) ([^ ]*) - (.*)$";

    Pattern p = Pattern.compile(regex);
    String[] samples = {
            "2015-01-22 01:52:54,237 [http-bio-80-exec-5] FATAL   TestLog4jServlet - Show FATAL message"
        };

    Matcher m = p.matcher(samples[1]);
    System.out.println(m.matches());
    if (m.matches() && m.groupCount() == 6) {
        String date = m.group(1);
        String time = m.group(2);
        String threadId = m.group(3);
        String priority = m.group(4);
        String category = m.group(5);
        String message = m.group(6);

        System.out.println("date: " + date);
        System.out.println("time: " + time);
        System.out.println("threadId: " + threadId);
        System.out.println("priority: " + priority);
        System.out.println("category: " + category);
        System.out.println("message: " + message);
    }
}

2 个答案:

答案 0 :(得分:2)

因为FATALTestLog4jServlet之间有两个空格,但您在正则表达式中只包含一个空格。所以我建议你用允许一个或多个空格的<space>+替换相应的空格。

(\d{4}-\d{2}-\d{2}) (\d{2}:\d{2}:\d{2},\d{3}) \[(.*?)\] ([^ ]*) +([^ ]*) - (.*)$
                                                                ^
                                                                |

DEMO

Java正则表达式,

"(\\d{4}-\\d{2}-\\d{2}) (\\d{2}:\\d{2}:\\d{2},\\d{3}) \\[(.*)\\] ([^ ]*) +([^ ]*) - (.*)$"

答案 1 :(得分:0)

我认为Logstash更适合解析日志。