我正在尝试在python中运行一些正则表达式,以将不同的文本模式放入不同的文件中。事实证明,我的源文件中99%以上的行都有这样的3行格式:
12340987 some other text
some text
some text
但是我很可能该模式将有四行,如下所示:
123456789 Some text
Some text
some text
one extra line of text
我试图写一个正则表达式来追逐所有的4行模式,并从这开始:
^[0-9]+([\s\S]*?)(?=^[0-9])
我如何使用这样的要点构建一些东西,但只能抓住4行模式?感谢阅读,如果可以的话,给予帮助。 :)
答案 0 :(得分:0)
您可以尝试这样的事情:
^[0-9]+.+$\s(?:^(?!\d).+$\s?){3}
标志gm
设置
见https://regex101.com/r/TOoCzF/1
说明:
^[0-9]+.+$\s
=行首,后跟数字,然后是行,行尾和换行符
然后
(?:^(?!\d).+$\s?){3}
=不是以数字