一个快速的正则表达式的事情

时间:2012-12-25 09:22:15

标签: regex

<img src=​"http:​/​/​Some_image.png" alt=​"somethingIdonotneed"

任务:仅对图像位(src="this stuff.png")进行分组,忽略其余部分

另外,出于某种原因,在我发现这个的HTML中,没有</img>。我以为所有标签都关闭了?

由于

3 个答案:

答案 0 :(得分:1)

这里的快速解决方法是

/img\s+(src="[^"]+")/

我强烈建议您不要使用正则表达式解析HTML。


此外,这是list of self-closing ("void") tags。即,它们不需要</...>结束标记。

<area>
<base>
<basefont>
<br>
<col>
<command>
<embed>
<hr>
<input>
<img>
<keygen>
<link>
<meta>
<param>
<source>
<track>
<wbr>

答案 1 :(得分:0)

试试这个,

/img[^>]+?(src\s*=\s*\"[^\"]*\")/i

你应该得到第一组。

答案 2 :(得分:0)

这个正则表达式将捕获(整个,没有组)你想要的东西:

(?<=<img )src="[^"]+"