使用python从.gz文件中删除特定的行(模式)以获取大文件大小

时间:2015-06-16 12:42:51

标签: python gz

我正在使用.gz扩展文件,其中我需要从文件中删除特定模式,处理时间最短,而根本不更改文件。

1 个答案:

答案 0 :(得分:1)

您是否尝试过使用gzip.GzipFile?参数类似于open

如果某个条件不匹配,从文件读取行并写入其他文件的示例:

import gzip

with gzip.GzipFile('output.gz', 'w') as fout:
    with gzip.GzipFile('input.gz','r') as fin:
        for line in fin:
            if not your_remove_condition(line):
                fout.write(line)

请注意,输入和输出文件必须不同。