我正在使用REGEX(c#和JS)从较大的文档中提取文本块。
使用此REGEX标识文本块的开始(和名称)的方法是
{{1}}
文档中有多个块,每个块具有不同的布局和长度。
如何捕获每次初始匹配(并捕获)之后到文档末尾的数据块?
我已经尝试了([。\ s \ n] *)之类的所有简单内容以及其他基本构造,但是在发现每个块的起点之后,似乎无法成功处理数据。
我确定我在这里遗漏了一些非常简单的东西,我只是想不到。我几年没有使用REGEX了,非常生锈。任何帮助将不胜感激。
欢呼
青蛙
答案 0 :(得分:0)
这是您可以尝试的一般模式:
General Information:((?!\r?\nGeneral Information:).)*
它与节的开头匹配,然后使用一个经过修饰的点(使用负数超前)一次消耗一个字符。当正则表达式遇到换行符并随后开始下一部分时,前瞻将失败,从而停止比赛。