用于匹配HTML标记的JavaScript惰性正则表达式

时间:2010-06-17 05:43:44

标签: javascript html regex

我在编写用于匹配HTML标记的正则表达式时遇到问题。我发现了一个similar entry here,但这在我的情况下并不常用。

这是我的测试字符串:

<div id="div0" class="myclass">here's some text
that may include whitespace</div><div id="div1" class="myclass">
and some more here
</div>

这是我的正则表达式基于上述条目:

<div[^>]*class="myclass">[^~]*?<\/div>

请注意,我需要将<div />的第一个实例与“myclass”类匹配。内容可能有回车。这些<div>代码不会嵌套。

这是一个用于测试的rubular页面:http://rubular.com/r/vlfcikKMXk

1 个答案:

答案 0 :(得分:1)

测试的正则表达式不是很好。它实际上是你想要的匹配,但它匹配多次(2个不同的匹配),并没有显示差异,你只想要第一个匹配。

转到此处: http://gskinner.com/RegExr/

在那里进行测试,关闭“全局”,你会看到它正常工作。