正则表达式选择多个字段

时间:2017-06-01 16:10:20

标签: regex pcre

从以下示例模式中,我想选择行中的前3个条目。

说:

  1. 时间戳
  2. 主机名
  3. 主机名后面的第一个单词
  4. 示例模式:

    2017-04-24T09:20:01.687387+00:00 aabvabcw74.def.co.uk hostd-probe: lacp: DEBUG]:147, Recv signal 15, LACP service is about to stop

    2017-04-24T09:20:01.687387+00:00 aacdefabcw74.def.co.uk hostd-probe: lacp: DEBUG]:147, Recv signal 15, LACP service is about to stop

    我使用了以下正则表达式并且工作正常。

    REGEX 1 - ^(?:[^ \ s] \ s){1}([^ \ s] ) - 选择时间戳和主机名。 REGEX 2 - ^(?:[^ \ s] * \ s){2}([^ \ s] \ w +) - 选择主机名后面的单词。

    2017-04-24T09:20:01.687387+00:00 hostd probing is done Fdm: sslThumbprint>95:43:64:71:A3:60:D8:17:C8:6F:68:83:92:CE:E4:3B:53:4E:1D:AD10.199.6.5a2:0e:09:01:0a:00a2:0e:09:01:0b:01/vmfs/volumes/b01f388c-aaa4889f/vmfs/volumes/6ad2d8d7-86746df14435.5.03568722host-619286aabvabcs16.def.co.uk

    但上面的日志已经产生了问题,因为它没有采用标准的系统日志格式,而是选择了#34; hostd"作为主机名。

    我想要正则表达式,需要选择时间戳作为第一个条目的日志,主机名作为第二个条目(它始终以.def.co.uk结尾),如果它满足两者,则选择第3个条目。

    我怎样才能做到这一点?

1 个答案:

答案 0 :(得分:0)

^(\S+[^\s])\s(\w+\.def.co.uk)\s(.+?)\s Demo

细分:

  1. (\S+[^\s])\s捕获日期和时间戳,并在其后留出空格
  2. (\w+\.def.co.uk)\s只有在包含something.def.co.uk并且再次留空时才会捕获
  3. (.+)?非贪婪地捕获第一个单词(假设单词表示之间没有空格
  4. 编辑:

    除非您还希望日期和时间在他们自己的捕获组中,否则它应该是like this

    ^(\S+)(T\S+)\s(\w+\.def.co.uk)\s(.+?)\s

    希望这有帮助!