在ELB日志的正则表达式中对项目进行分组

时间:2018-04-17 13:44:19

标签: javascript regex

在此正则表达式中,https://regex101.com/r/SzzJDE/7如何对__utm.gif

进行分组

我有

\"(\S+)\s+\w+:\/\/([\w\-\.]*):\S+(\/\S+\s+)([^\"]+)\"

但我不确定如何最好地提取它?

非常感谢任何建议。

2 个答案:

答案 0 :(得分:1)

如果你检查你的regex101样本,你会发现它是目前抓住你__utm.gif的第三个群组;它以您不想分组的\/开头,然后与\S+\s+匹配到网址的末尾。在该部分之前添加的内容仅与排除的?匹配,并将该组分组:

\"(\S+)\s+\w+:\/\/([\w\-\.]*):\S+(\/([^?]+)\S+\s+)([^\"]+)\"
                                    ^^^^^^^

答案 1 :(得分:0)

正则表达式

(?:\b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b:[0-9]+\s+)+(.*)\s+"GET\s+(http(?:.*)\.(?:gif))

演示 https://regex101.com/r/WKbwhk/1