在此正则表达式中,https://regex101.com/r/SzzJDE/7如何对__utm.gif
我有
\"(\S+)\s+\w+:\/\/([\w\-\.]*):\S+(\/\S+\s+)([^\"]+)\"
但我不确定如何最好地提取它?
非常感谢任何建议。
答案 0 :(得分:1)
如果你检查你的regex101样本,你会发现它是目前抓住你__utm.gif
的第三个群组;它以您不想分组的\/
开头,然后与\S+\s+
匹配到网址的末尾。在该部分之前添加的内容仅与排除的?
匹配,并将该组分组:
\"(\S+)\s+\w+:\/\/([\w\-\.]*):\S+(\/([^?]+)\S+\s+)([^\"]+)\"
^^^^^^^
答案 1 :(得分:0)
正则表达式
(?:\b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b:[0-9]+\s+)+(.*)\s+"GET\s+(http(?:.*)\.(?:gif))