Question

我正在使用REGEX（c＃和JS）从较大的文档中提取文本块。

使用此REGEX标识文本块的开始（和名称）的方法是

{{1}}

文档中有多个块，每个块具有不同的布局和长度。

如何捕获每次初始匹配（并捕获）之后到文档末尾的数据块？

我已经尝试了（[。\ s \ n] *）之类的所有简单内容以及其他基本构造，但是在发现每个块的起点之后，似乎无法成功处理数据。

我确定我在这里遗漏了一些非常简单的东西，我只是想不到。我几年没有使用REGEX了，非常生锈。任何帮助将不胜感激。

欢呼

青蛙

Answer 1

这是您可以尝试的一般模式：

General Information:((?!\r?\nGeneral Information:).)*

它与节的开头匹配，然后使用一个经过修饰的点（使用负数超前）一次消耗一个字符。当正则表达式遇到换行符并随后开始下一部分时，前瞻将失败，从而停止比赛。

Demo