Python在3个csv文件中查找重复项

时间:2016-03-23 00:33:58

标签: python csv

如何查找3个csv文件中出现的重复项? 到目前为止,我可以找到重复的两个文件。

import csv

with open('tidyforms.com.csv', 'rU') as master:
    master_indices = dict((r[0], i) for i, r in enumerate(csv.reader(master)))

with open('jotform.com.csv', 'rU') as hosts:
    with open('similar.csv', 'wb') as results:    
        reader = csv.reader(hosts)
        writer = csv.writer(results)

        writer.writerow(next(reader, []))

        for row in reader:
            index = master_indices.get(row[0])
            if index is not None:
                message = 'FOUND in master list (row {})'.format(index)
                writer.writerow(row)

1 个答案:

答案 0 :(得分:1)

你分四步完成

  1. 打开文件A,将值存储在主词典中。

  2. 打开文件B,检查主词典中是否已存在任何B值。

  3. 在主词典中添加B的值。

  4. 打开文件C,检查主词典中是否已存在任何C值。

  5. 查看代码,您已经实施了第1步和第2步。