验证HTML标记的正则表达式运算符

时间:2014-03-07 17:38:45

标签: html regex

我正在关注Regular Expression.info,并在他们的samples page上看到一个表达式,以匹配HTML标签,如下所示:

([A-Z][A-Z0-9]*)\b[^>]*>(.*?)</\1>

部分\ b [^]的语义效果是什么?我得到了一个单词边界但是给出了它后面的目的是什么?

1 个答案:

答案 0 :(得分:0)

它匹配任何额外的(如果它存在)直到下一次出现“&gt;” (关闭HTML标记)。这会捕获像class="classname" id="idname"这样的东西。但是,它也会捕获您能想到的任何角色,例如•·°ÁÓ,这可能是您想要的,也可能不是。与往常一样,正确的HTML解析器是解析HTML的方法。