Question

我正在尝试在python中运行一些正则表达式，以将不同的文本模式放入不同的文件中。事实证明，我的源文件中99％以上的行都有这样的3行格式：

12340987  some other text
          some text
          some text

但是我很可能该模式将有四行，如下所示：

123456789   Some text
            Some text
            some text
            one extra line of text

我试图写一个正则表达式来追逐所有的4行模式，并从这开始：

^[0-9]+([\s\S]*?)(?=^[0-9])

我如何使用这样的要点构建一些东西，但只能抓住4行模式？感谢阅读，如果可以的话，给予帮助。：）

Answer 1

您可以尝试这样的事情：

^[0-9]+.+$\s(?:^(?!\d).+$\s?){3}

标志gm设置

说明： ^[0-9]+.+$\s =行首，后跟数字，然后是行，行尾和换行符

然后 (?:^(?!\d).+$\s?){3} =不是以数字

开头的行的3倍