看似简单的REGEX

时间:2018-08-31 02:07:50

标签: regex

我正在使用REGEX(c#和JS)从较大的文档中提取文本块。

使用此REGEX标识文本块的开始(和名称)的方法是

{{1}}

文档中有多个块,每个块具有不同的布局和长度。

如何捕获每次初始匹配(并捕获)之后到文档末尾的数据块?

我已经尝试了([。\ s \ n] *)之类的所有简单内容以及其他基本构造,但是在发现每个块的起点之后,似乎无法成功处理数据。

我确定我在这里遗漏了一些非常简单的东西,我只是想不到。我几年没有使用REGEX了,非常生锈。任何帮助将不胜感激。

欢呼

青蛙

1 个答案:

答案 0 :(得分:0)

这是您可以尝试的一般模式:

General Information:((?!\r?\nGeneral Information:).)*

它与节的开头匹配,然后使用一个经过修饰的点(使用负数超前)一次消耗一个字符。当正则表达式遇到换行符并随后开始下一部分时,前瞻将失败,从而停止比赛。

Demo