我正在关注Regular Expression.info,并在他们的samples page上看到一个表达式,以匹配HTML标签,如下所示:
([A-Z][A-Z0-9]*)\b[^>]*>(.*?)</\1>
部分\ b [^]的语义效果是什么?我得到了一个单词边界但是给出了它后面的目的是什么?
答案 0 :(得分:0)
它匹配任何额外的(如果它存在)直到下一次出现“&gt;” (关闭HTML标记)。这会捕获像class="classname" id="idname"
这样的东西。但是,它也会捕获您能想到的任何角色,例如•·°ÁÓ
,这可能是您想要的,也可能不是。与往常一样,正确的HTML解析器是解析HTML的方法。