在两个列表上同时迭代的pythonic方法是什么?
假设我想逐行比较两个文件(将一个文件中的每个i
行与另一个文件的i
行进行比较),我想做类似这样的事情:
file1 = csv.reader(open(filename1),...)
file2 = csv.reader(open(filename2),...)
for line1 in file1 and line2 in file2: #pseudo-code!
if line1 != line2:
print "files are not identical"
break
实现这一目标的pythonic方式是什么?
修改:我没有使用文件处理程序,而是使用CSV阅读器(csv.reader(open(file),...)
),而zip()
似乎无法使用它... < / p>
最终编辑:,如@Alex M.建议,zip()
在第一次迭代时将文件加载到内存中,因此在大文件上这是一个问题。在Python 2上,使用itertools
解决了这个问题。
答案 0 :(得分:14)
在Python 2中,您应导入itertools并使用其izip:
with open(file1) as f1:
with open(file2) as f2:
for line1, line2 in itertools.izip(f1, f2):
if line1 != line2:
print 'files are different'
break
使用内置的zip
,两个文件将在循环开始时立即完全读入内存,这可能不是您想要的。在Python 3中,内置的zip
与itertools.izip
的工作方式类似于Python 2中的工作 - 逐步增加。
答案 1 :(得分:9)
我投票赞成使用zip
。 manual建议“要同时循环两个或多个序列,条目可以与zip()函数配对”
例如,
list_one = ['nachos', 'sandwich', 'name']
list_two = ['nachos', 'sandwich', 'the game']
for one, two in zip(list_one, list_two):
if one != two:
print "Difference found"
答案 2 :(得分:3)
在锁步中(对于Python≥3):
for line1, line2 in zip(file1, file2):
# etc.
作为“2D阵列”:
for line1 in file1:
for line2 in file2:
# etc.
# you may need to rewind file2 to the beginning.