是否有使用正则表达式获取所有HTML元素的技巧?拿这个HTML片段,例如:
<div>
<p>test
<span>blub</span></p>
</div>
按正确顺序赞:
array(
0=>'<div>
<p>test
<span>blub</span></p>
</div>',
1=>'<p>test
<span>blub</span></p>'
2=>'<span>blub</span>'
)
我想到了
的东西 (<([A-z]+)[^>]*>.*?</\2>)
答案 0 :(得分:1)
看看这个问题:regex match html element with html children
您无法使用正则表达式真正解析HTML。使用PHP或其他语言来解析HTML。
答案 1 :(得分:0)
快速而肮脏
<[^>]+>
如果您使用'&gt;'字符串,请不要指望此功能正常工作他们内心。