日志格式的正则表达式

时间:2015-04-07 10:28:40

标签: python regex string

有人可以帮我写一个特定日志格式的正则表达式吗?下面是示例日志和我为它编写的正则表达式,但它不起作用。

Log : 64.242.88.10 - - [07/Mar/2004:16:05:49 -0800] "GET
/twiki/bin/edit/Main/Double_bounce_sender?topicparent=Main.ConfigurationVariables
HTTP/1.1" 401 12846

我试过的正则表达式是:"%h - - %t \"%r\" %>s %b"

2 个答案:

答案 0 :(得分:0)

每个日志可能存储在单独的行中。试试简单:

"Log : .* \n"

或指定您想要匹配和检索的内容。

答案 1 :(得分:0)

您可以尝试这样的事情:Log\s*:\s*([\d.]+)[\s-]+\[([\d\/A-Za-z: -]+)\]\s+"([A-Z]+)\s+(.+?)"\s+([\s\d]+)

这会将以下内容与小组匹配:

  1. 64.242.88.10
  2. 07 / Mar / 2004:16:05:49 -0800
  3. GET
  4. /twiki/bin/edit/Main/Double_bounce_sender?topicparent=Main.ConfigurationVariables HTTP / 1.1
  5. 401 12846
  6. 有一个例子here