wget在提取必备文件方面做得很好,但它无法检测JS文件中的图像路径。我需要一个正则表达式来扫描它找到的任何图像路径的JS文件。
这些路径通常嵌套如下:
$img1 = "foo/bar.png";
$img2 = 'foo/bar.jpg';
$img3 = "{'myimg':'foo/bar.png'}";
我需要一个正则表达式,它能够在引号内拾取整个图像路径,但有时嵌套在json字符串中,或者以其他方式编码...本质上,通过检测整个图像路径的存在来匹配整个图像路径扩展(jpg | png | gif)。
答案 0 :(得分:1)
尝试使用此模式:
$pattern = '~/?+(?>[^"\'/]++/)+[^"\'\s]+?\.(?>(?>pn|jpe?)g|gif)\b~';