preg_match_all模式html标记问题

时间:2013-02-17 13:25:47

标签: php regex preg-match-all

有4种不同的img标签

<img src="img1.jpg" alt="test" />
<img src="img2.jpg" height="21"/>
<img src="img3.jpg" border="1">
<img src="img4.jpg" >

我使用PHP代码

preg_match_all('#<img (.*?)([/>| />|>| >])#si',$this->Data,$img);  

但是这个PHP代码结果

Array
  (
[1] => Array
    (
        [0] => src="img1.jpg"
        [1] => src="img2.jpg"
        [2] => src="img3.jpg"
        [3] => src="img4.jpg"

    )  

我想结果:

    Array
  (
[1] => Array
    (
        [0] => src="img1.jpg" alt="test"
        [1] => src="img2.jpg" height="21"
        [2] => src="img3.jpg" border="1"
        [3] => src="img4.jpg"

    )  

你能帮帮我吗?

2 个答案:

答案 0 :(得分:1)

试试这个:

preg_match_all('#<img (.*?)\s?/?>#is', $this->Data, $img);  

\s?可选地匹配由可选斜杠/?解决的空格。

这基本上可以从格式良好的img标签中获取任何内容。 (假设您在属性的值中没有任何&gt;。)

要记住,正则表达式不是解析html的正确工具 - 但对于小 - 限制 - 匹配它非常有用。

答案 1 :(得分:0)

看起来像给你想要的东西;

$s = '<img src="img1.jpg" alt="test" />
      <img src="img2.jpg" height="21"/>
      <img src="img3.jpg" border="1">
      <img src="img4.jpg" >';
preg_match_all('~<img\s+(.+?)([\s/>]|)>~i', $s, $m);
print_r($m);

出;


Array
(
    ...
    [1] => Array
        (
            [0] => src="img1.jpg" alt="test" 
            [1] => src="img2.jpg" height="21"
            [2] => src="img3.jpg" border="1"
            [3] => src="img4.jpg" 
        )

顺便说一下,据我所知,您不需要使用s标记preg_match_all,因为它匹配*_all。< / p>