如何使用正则表达式获取所有属性?

时间:2015-01-22 10:16:50

标签: php regex attributes

我制作了这个正则表达式以获取标记中的所有属性" img"。

 /<img\s+(?:([a-z_-]+)\s*=\s*"(.*?)"\s*)*\s*\/>/g

但是,它只需要一个最后一个属性。

如何使用正则表达式获取所有属性?

测试字符串:

 <img src="abc.png" alt="abc" />
 <img alt="def" src="def.png" />
 <img src="abc.png" alt="abc" style="border:none" />
 <img alt="def" src="def.png" style="border:none" />

结果:(使用http://www.regex101.com

 MATCH 1
 1. [19-22] `alt`
 2. [24-27] `abc`

 MATCH 2
 1. [47-50] `src`
 2. [52-59] `def.png`

 MATCH 3
 1. [93-98] `style`
 2. [100-111]   `border:none`

 MATCH 4
 1. [145-150]   `style`
 2. [152-163]   `border:none`

2 个答案:

答案 0 :(得分:7)

我建议你按顺序使用\G锚来进行连续的字符串匹配。

(?:<img|(?<!^)\G)\h*([\w-]+)="([^"]*)"(?=.*?\/>)

从组索引1获取属性并从组索引2获取值。

DEMO

$string = <<<EOT
 <img src="abc.png" alt="abc" />
 <img alt="def" src="def.png" />
 <img src="abc.png" alt="abc" style="border:none" />
 <img alt="def" src="def.png" style="border:none" />
EOT;
preg_match_all('~(?:<img|(?<!^)\G)\h*(\w+)="([^"]+)"(?=.*?\/>)~', $string, $match);
print_r($match[1]);
print_r($match[2]);

输出:

Array
(
    [0] => src
    [1] => alt
    [2] => alt
    [3] => src
    [4] => src
    [5] => alt
    [6] => style
    [7] => alt
    [8] => src
    [9] => style
)
Array
(
    [0] => abc.png
    [1] => abc
    [2] => def
    [3] => def.png
    [4] => abc.png
    [5] => abc
    [6] => border:none
    [7] => def
    [8] => def.png
    [9] => border:none
)

答案 1 :(得分:2)

试试这个:

/(\w+)=["']([a-zA-Z0-9_.:'"]+)["']/

请记住,如果你使用php选项g不支持,请使用preg_match_all()函数

请尝试:https://regex101.com/r/cQ8jT2/1