我有一个HTML文件,其中包含以下代码段。
<div class="col-sm-2 col-sm-offset-1">
<div class="countBox success" id="success">
<h2>467</h2>
Passed Tests
<span class="glyphicon glyphicon-eye-open"></span>
</div>
</div>
我有一个正则表达式(。*)&lt; / h2&gt; \ r \ nPassed 来获取值467.它一直工作到昨天。但是,它现在不起作用。我试过用双斜杠替换单斜杠到新的行和行。使用&#34; \ s +&#34;覆盖空白。一切都失败了。任何人都可以通过使用正则表达式为上面的代码片段指导我如何获得467的值?
答案 0 :(得分:0)
最好抓住<h2>(\d+)</h2>
以确保只有一个带有数字的h2
标头。顺便说一句,\r\n
只是一个约定(在窗口中)来表示行尾,但在unix中它只是\n
所以为了更加独立于平台,你可以做\r?\n
(将\r
标记为可选)并且你必须得到Passed.
前面的空格,所以一个好的(但可能不是最好的)正则表达式将是:
<h2>(\d+)<\/h2>\r?\n\s*Passed
请参阅demo。