Question

我正在关注Regular Expression.info，并在他们的samples page上看到一个表达式，以匹配HTML标签，如下所示：

([A-Z][A-Z0-9]*)\b[^>]*>(.*?)</\1>

部分\ b [^]的语义效果是什么？我得到了一个单词边界但是给出了它后面的目的是什么？

Answer 1

它匹配任何额外的（如果它存在）直到下一次出现“＆gt;” （关闭HTML标记）。这会捕获像class="classname" id="idname"这样的东西。但是，它也会捕获您能想到的任何角色，例如•·°ÁÓ，这可能是您想要的，也可能不是。与往常一样，正确的HTML解析器是解析HTML的方法。

验证HTML标记的正则表达式运算符

1 个答案: