我在正则表达式中找不到我的问题,在我的最后一个元素页脚,最后一个匹配应该是页脚这个元素,但它给了我最后一个匹配 html ......知道我做错了什么?这是我的正则表达式代码https://regex101.com/r/rJ6vV1/3
答案 0 :(得分:0)
只需在否定字符类中添加<
或>
。
<(.+) data-edit="true" data-id="(.*)"(.*?)>([^<"]*)<\/(.+)>
^
[^"]
匹配除双引号之外的所有字符,因此<
,\n
也匹配。
始终使用如下所示的非贪婪正则表达式。
<(.+?) data-edit="true" data-id="(.*?)"(.*?)>([^>"]*)<\/(.+?)>
像其他人说的那样,不要使用正则表达式来解析html文件。只有在知道后果的情况下才能使用它。