Python双重迭代

时间:2010-03-06 17:42:29

标签: python

在两个列表上同时迭代的pythonic方法是什么?

假设我想逐行比较两个文件(将一个文件中的每个i行与另一个文件的i行进行比较),我想做类似这样的事情:

file1 = csv.reader(open(filename1),...)
file2 = csv.reader(open(filename2),...)

for line1 in file1 and line2 in file2: #pseudo-code!
    if line1 != line2:
        print "files are not identical"
        break

实现这一目标的pythonic方式是什么?


修改:我没有使用文件处理程序,而是使用CSV阅读器(csv.reader(open(file),...)),而zip()似乎无法使用它... < / p>


最终编辑:,如@Alex M.建议,zip()在第一次迭代时将文件加载到内存中,因此在大文件上这是一个问题。在Python 2上,使用itertools解决了这个问题。

3 个答案:

答案 0 :(得分:14)

在Python 2中,您应导入itertools并使用其izip

with open(file1) as f1:
  with open(file2) as f2:
    for line1, line2 in itertools.izip(f1, f2):
      if line1 != line2:
        print 'files are different'
        break

使用内置的zip,两个文件将在循环开始时立即完全读入内存,这可能不是您想要的。在Python 3中,内置的zipitertools.izip的工作方式类似于Python 2中的工作 - 逐步增加。

答案 1 :(得分:9)

我投票赞成使用zipmanual建议“要同时循环两个或多个序列,条目可以与zip()函数配对”

例如,

list_one = ['nachos', 'sandwich', 'name']
list_two = ['nachos', 'sandwich', 'the game']
for one, two in zip(list_one, list_two):
   if one != two:
      print "Difference found"

答案 2 :(得分:3)

在锁步中(对于Python≥3):

for line1, line2 in zip(file1, file2):
   # etc.

作为“2D阵列”:

for line1 in file1:
   for line2 in file2:
     # etc.
   # you may need to rewind file2 to the beginning.