匹配所有HTML标记的正则表达式包含<p>和</p>

时间:2009-11-17 09:50:47

标签: regex

通过代码,我得到了输出内容为XML。 我有一对或多个html标签如下:

12月10日

欢迎来到这个空间

Hai,今天是星期二

这是一个xml标签

我想要一个正则表达式,如下所示:

如上所述,我只想要一个EMPTY对Tag

。我不希望重复的EMPTY无限期或明确的对标签。

请在这方面帮助我使用正则表达式来克服这个问题。

2 个答案:

答案 0 :(得分:2)

问号使表达式非贪婪,因此只匹配两个标签之间的内容,而不是第一个开头和最后一个结束标签之间的内容。 这假设您没有嵌套的p标签,否则您将遇到这个问题......

/<p>(.*?)<\/p>/

显然,您将不得不使用PHP中的preg_match_all,具体取决于您使用的语言。您将在第一个匹配组中找到标记的内容。

答案 1 :(得分:1)

如果您有嵌套的p块怎么办?再次使用Regex解析HTML代码同样错误,DOM用于解析HTML而不是Regex。 Parsing Html The Cthulhu Way