麻烦复杂的多行正则表达式

时间:2015-12-03 11:49:34

标签: python regex

我正在尝试使用复杂的正则表达式解析python中的大型日志。 我正在寻找的序列在多个连续的行上,可能有正面或负面的结果。这是带有测试数据的正则表达式:

以下是我的问题:https://regex101.com/r/pF3eM6/1

正则表达式做了它应该做的事情,拉动开始和结束日期,源和目标格式,作业ID和完成时间或“超时”。但是,当序列未完成时(如文件末尾),表达式最终会出错(尝试删除最后一行)。我希望表达式只是忽略这样的序列(不匹配)。

为了完整起见,这里使用了与日志文件的“Time Out”变体相同的正则表达式 - 以及与上面相同的问题。 https://regex101.com/r/pF3eM6/2

有人可以帮助我了解发生了什么以及为什么会发生这种情况吗?

1 个答案:

答案 0 :(得分:0)

不得不完全重写它,我在http://regular-expressions.info阅读文章,我终于明白了正则表达式是如何工作的:) 对于后代,这是评论的解决方案: https://regex101.com/r/pF3eM6/8