如何在非html文件中找到html标签?

时间:2011-11-18 12:37:18

标签: html regex

我无法解析它,因为它不是一个html文件,它是一个简单的文本,有时它可以隐藏一个有效的html标签开口,如:

<a href="..." >

但也是:

<anytag par1="val1" par2='val2' par3=val3 />

如果没有这种可能性,一切都会好起来很容易:

<anytag param='square < brackets > in value' par2="and < another < such case" >

如何将其与正则表达式相匹配?

(这不是有效的html,标签是(可能)在正常的txt文件中,并且是松散的,不包含在任何适当的结构中,并且不总是关闭。(但是标题当然总是关闭的使用>,查看示例。)我对标签内部的内容不感兴趣,但仅限于打开标题。)

1 个答案:

答案 0 :(得分:0)

尝试这样的事情:

$regEx = "/(<[a-z A-Z]+(=\"[a-z A-z]\")*)+>/";

首先,它检查它是否包含1个或更多&lt;,然后检查它是否包含零个或多个a-z =“a-z”,然后一个&gt;。