<img src="http://Some_image.png" alt="somethingIdonotneed"
任务:仅对图像位(src="this stuff.png"
)进行分组,忽略其余部分
另外,出于某种原因,在我发现这个的HTML中,没有</img>
。我以为所有标签都关闭了?
由于
答案 0 :(得分:1)
这里的快速解决方法是
/img\s+(src="[^"]+")/
我强烈建议您不要使用正则表达式解析HTML。
此外,这是list of self-closing ("void") tags。即,它们不需要</...>
结束标记。
<area>
<base>
<basefont>
<br>
<col>
<command>
<embed>
<hr>
<input>
<img>
<keygen>
<link>
<meta>
<param>
<source>
<track>
<wbr>
答案 1 :(得分:0)
试试这个,
/img[^>]+?(src\s*=\s*\"[^\"]*\")/i
你应该得到第一组。
答案 2 :(得分:0)
这个正则表达式将捕获(整个,没有组)你想要的东西:
(?<=<img )src="[^"]+"