Python diff非常大的文件

时间:2014-06-24 16:00:17

标签: python diff

我有足够大的文件不适合内存,因此在UNIX shell上执行diff filea fileb > mydiff.txt不是一个选项。此外,我需要设置一个crontab来每天执行它,并使用Python 2.x

将不同的行插入到数据库中

我可以这样做:

with ('fileb'm 'rb').readlines() as fileb:
    with open('filea', 'rb') as filea:
        for line in filea:
            if line not in fileb:
                yield line

但这是1)慢和2)最有可能也不适合记忆。

对于这种情况,是否有一种快速,pythonic的方式为diff做点什么?

0 个答案:

没有答案