RegEx与具有特定属性的HTML标记匹配

时间:2016-10-26 20:34:14

标签: regex regex-negation regex-lookarounds

我正在尝试编写一个与开头HTML标记匹配的RegEx,其上包含class属性。如下所示:

<!-- these should match -->
<div class=" 
<div class=">
<img src="image.jpg" class="
<img src="image.jpg" class=">

<!-- these should not match -->
<div> class="
</div class=">

到目前为止,我有:

<[^/^>]+>

这匹配任何打开的HTML标记。我正在调整它以寻找其中的class属性,就像上面的例子一样。

1 个答案:

答案 0 :(得分:0)

试试这个:

<[[a-z]{1,} class=">?

这非常简单,只会与您的示例相匹配。如果你想在任何地方捕捉任何带有类属性的开始标记,你就必须做一些更复杂的事情。

另外,我喜欢用这个: https://regex101.com/

用于测试在线正则表达式,这是一个非常有用的小游乐场。