用于格式化Apache日志的PHP正则表达式模式

时间:2012-06-19 09:56:11

标签: php regex apache logging

我有这个正则表达式模式适用于我当前的apache日志格式:

preg_match("/^(\S+) (\S+) (\S+) \[([^:]+):(\d+:\d+:\d+) ([^\]]+)\] \"(\S+) (.*?) (\S+)\" (\S+) (\S+) (\".*?\") (\".*?\")$/", $line, $matches); // pattern to format the line

它适用于此日志:

127.0.0.1 - - [19/Jun/2012:11:38:37 +0200] "GET /some_page HTTP/1.1" 200 8243 "http://example.com/referrer" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.56 Safari/536.5"

现在我已经更改了apache日志格式以包含服务器名称,因此新日志将是:

127.0.0.1 - - [19/Jun/2012:11:38:37 +0200] **servername.com** "GET /some_page HTTP/1.1" 200 8243 "http://example.com/referrer" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.56 Safari/536.5"

它唯一能做的就是在“GET / url ...”之前添加servername.com。

现在正则表达式不再起作用了,我不知道我需要修改什么才能使它与新的日志格式匹配。

1 个答案:

答案 0 :(得分:1)

这是您更新的正则表达式:

preg_match("/^(\S+) (\S+) (\S+) \[([^:]+):(\d+:\d+:\d+) ([^\]]+)\] [\w.]+ \"(\S+) (.*?) (\S+)\" (\S+) (\S+) (\".*?\") (\".*?\")$/", $line, $matches);

我添加了一个与您的服务器名称匹配的额外 [\ w。] + 组。