我在编写用于匹配HTML标记的正则表达式时遇到问题。我发现了一个similar entry here,但这在我的情况下并不常用。
这是我的测试字符串:
<div id="div0" class="myclass">here's some text
that may include whitespace</div><div id="div1" class="myclass">
and some more here
</div>
这是我的正则表达式基于上述条目:
<div[^>]*class="myclass">[^~]*?<\/div>
请注意,我需要将<div />
的第一个实例与“myclass”类匹配。内容可能有回车。这些<div>
代码不会嵌套。
这是一个用于测试的rubular页面:http://rubular.com/r/vlfcikKMXk
答案 0 :(得分:1)
测试的正则表达式不是很好。它实际上是你想要的匹配,但它匹配多次(2个不同的匹配),并没有显示差异,你只想要第一个匹配。
转到此处: http://gskinner.com/RegExr/
在那里进行测试,关闭“全局”,你会看到它正常工作。