描述

Question

我有一个很长的单行HTML字符串。我正在尝试使用正则表达式匹配以<br>开头的行之后的START标记。该行中的最后一个字会有所不同。

HTML：

<br>This is the first sentence<br>START capture tag<br>This is the third sentance<br>

我能够使用这个表达式捕获句子：

START.*?(?=<)

我无法弄清楚如何选择尾随的br标签而不包括之前的句子。我尝试使用积极的外观，但它不接受量词。

任何帮助都将不胜感激！

Answer 1

通过使用\K，我们可以将捕获重置为仅匹配所需的文本。

START.*?\K<br>

Regular expression visualization

有关\K的更多信息，请访问regular-expressions.info/keep.html