如何查找3个csv文件中出现的重复项? 到目前为止,我可以找到重复的两个文件。
import csv
with open('tidyforms.com.csv', 'rU') as master:
master_indices = dict((r[0], i) for i, r in enumerate(csv.reader(master)))
with open('jotform.com.csv', 'rU') as hosts:
with open('similar.csv', 'wb') as results:
reader = csv.reader(hosts)
writer = csv.writer(results)
writer.writerow(next(reader, []))
for row in reader:
index = master_indices.get(row[0])
if index is not None:
message = 'FOUND in master list (row {})'.format(index)
writer.writerow(row)
答案 0 :(得分:1)
你分四步完成
打开文件A,将值存储在主词典中。
打开文件B,检查主词典中是否已存在任何B值。
在主词典中添加B的值。
打开文件C,检查主词典中是否已存在任何C值。
查看代码,您已经实施了第1步和第2步。