使用正则表达式检索具有多个Url的行中的Url

时间:2014-11-17 07:36:50

标签: regex url

这是一个示例字符串。

<p style="text-align: center;"><a href="http://www.evangelical-library.org.uk" target="_blank"><img class="aligncenter wp-image-22582 size-full" src="http://the7.dream-demo.com/main/wp-content/uploads/sites/9/2014/05/show-04.png" alt="" width="372" height="225" /></a></p

two Url in a row

一个用于PNG,另一个用于网页。我想让Png网址像“http:..... png”一样。

它只是使用"http://.*?png",但它会从第一个"http://"网址中检索字符串,然后从第二个包含Png文件扩展名的网址中检索

我现在可以使用条件href and src来识别哪个属于Png url。但它会错过许多其他模式的网址,例如<png>Png url</png>

怎么可以解决?谢谢。

1 个答案:

答案 0 :(得分:0)

嗯,不要像Biffen评论那样用正则表达式解析html,但你可以提取一些内容,例如:

(?<=href=")[^"]+.png

会在模式开头为href="做一个lookbehind,将每个不是"的字符与最后的.png匹配。

花一小时学习正则表达式可以节省你来这里的时间。