正则表达式跨多个文件,匹配结果可以跨两个不同的文件

时间:2019-03-11 01:33:32

标签: python regex

是否可以在多个文件(在本例中为日志文件)中进行正则表达式,其中正则表达式可能会按文件名顺序匹配一个文件中的开始条件,而匹配下一个文件中的结束条件?

我需要从日志文件中匹配事件,从理论上讲,事件的开始可以在一个文件的结尾,而事件的结尾可以在下一个文件的开头。

到目前为止,我一直在读取所有文件并将它们串联成字符串并在其中进行正则表达式-但是,我最终遇到了一种情况,这种情况会导致MemoryError(这似乎是每天大约有800 MB的日志文件)。

我想知道是否可以直接在文件之间执行此操作,所以我不必在内存中的变量中维护所有内容吗?或者,如果还有另一种方法可以提高内存效率?

注意:操作系统是Windows 7

1 个答案:

答案 0 :(得分:0)

一次处理一个文件,但是当您找到事件开始行时,记下该文件和您看到它的行。找到事件结束线后,您将了解所需的一切。