我有一个很长的单行HTML字符串。我正在尝试使用正则表达式匹配以<br>
开头的行之后的START
标记。该行中的最后一个字会有所不同。
HTML:
<br>This is the first sentence<br>START capture tag<br>This is the third sentance<br>
我能够使用这个表达式捕获句子:
START.*?(?=<)
我无法弄清楚如何选择尾随的br标签而不包括之前的句子。我尝试使用积极的外观,但它不接受量词。
https://regex101.com/r/lM3eH7/1
任何帮助都将不胜感激!
答案 0 :(得分:1)
通过使用\K
,我们可以将捕获重置为仅匹配所需的文本。
START.*?\K<br>
现场演示:https://regex101.com/r/fM0bG0/1
有关\K
的更多信息,请访问regular-expressions.info/keep.html