如何使用正则表达式从HTML代码段中获取所有HTML元素?

时间:2012-12-19 23:31:54

标签: html regex

是否有使用正则表达式获取所有HTML元素的技巧?拿这个HTML片段,例如:

<div>
<p>test
<span>blub</span></p>
</div>

按正确顺序赞:

array(
0=>'<div>
<p>test
<span>blub</span></p>
</div>',

1=>'<p>test
<span>blub</span></p>'

2=>'<span>blub</span>'
)

我想到了

的东西
 (<([A-z]+)[^>]*>.*?</\2>)

2 个答案:

答案 0 :(得分:1)

看看这个问题:regex match html element with html children

您无法使用正则表达式真正解析HTML。使用PHP或其他语言来解析HTML。

答案 1 :(得分:0)

快速而肮脏

<[^>]+>

如果您使用'&gt;'字符串,请不要指望此功能正常工作他们内心。