我有足够大的文件不适合内存,因此在UNIX shell上执行diff filea fileb > mydiff.txt
不是一个选项。此外,我需要设置一个crontab来每天执行它,并使用Python 2.x
我可以这样做:
with ('fileb'm 'rb').readlines() as fileb:
with open('filea', 'rb') as filea:
for line in filea:
if line not in fileb:
yield line
但这是1)慢和2)最有可能也不适合记忆。
对于这种情况,是否有一种快速,pythonic的方式为diff
做点什么?