我在SO上搜索过类似的问题,但没有发现任何对我有用的东西。
我有两个大文件,它们应该是相同的,但其中一个文件比另一个文件长60行。我想知道这些线是什么以及我在哪里可以找到它们。
我已经读过可以使用difflib来做到这一点,但我无法弄清楚如何去做。我总是在文件中获得+
和-
,但我不想这样做。我只想扫描两个文件并将不常见的60行报告到第三个文件中。
我编写了这段代码,但它没有打印出不同的行。
f1 = open('file1.txt','r')
f2 = open('file2.txt','r')
f3 = open('file3.txt','w')
diff = set(f1).difference(f2)
same.discard('\n')
for line in same:
f3.write(line)
答案 0 :(得分:4)
嗯,你可以这样做:
with open('file1.txt') as infile:
f1 = infile.readlines()
with open('file2.txt') as infile:
f2 = infile.readlines()
only_in_f1 = [i for i in f1 if i not in f2]
only_in_f2 = [i for i in f2 if i not in f1]
with open('file3.txt', 'w') as outfile:
if only_in_f1:
outfile.write('Lines only in file 1:\n')
for line in only_in_f1:
outfile.write(line)
if only_in_f2:
outfile.write('Lines only in file 2:\n')
for line in only_in_f2:
outfile.write(line)
注意:不同行中的相同内容被视为差异
答案 1 :(得分:0)
您可以使用套装轻松解决此问题。
set1 = set()
with open(file1) as f:
for line in f:
set1.add(line.strip())
#Repeat for set 2
with open(diff_file, 'w') as f:
for line in set2 - set1:
f.write(line + '\n')