Python - 如何比较两个文件并仅输出第三个文件中的不同行

时间:2017-10-06 04:40:45

标签: python

我在SO上搜索过类似的问题,但没有发现任何对我有用的东西。

我有两个大文件,它们应该是相同的,但其中一个文件比另一个文件长60行。我想知道这些线是什么以及我在哪里可以找到它们。

我已经读过可以使用difflib来做到这一点,但我无法弄清楚如何去做。我总是在文件中获得+-,但我不想这样做。我只想扫描两个文件并将不常见的60行报告到第三个文件中。

我编写了这段代码,但它没有打印出不同的行。

f1 = open('file1.txt','r')
f2 = open('file2.txt','r')
f3 = open('file3.txt','w')

diff = set(f1).difference(f2)
same.discard('\n')

for line in same:
    f3.write(line)

2 个答案:

答案 0 :(得分:4)

嗯,你可以这样做:

with open('file1.txt') as infile:
    f1 = infile.readlines()

with open('file2.txt') as infile:
    f2 = infile.readlines()

only_in_f1 = [i for i in f1 if i not in f2]
only_in_f2 = [i for i in f2 if i not in f1]

with open('file3.txt', 'w') as outfile:
    if only_in_f1:
        outfile.write('Lines only in file 1:\n')
        for line in only_in_f1:
            outfile.write(line)

    if only_in_f2:
        outfile.write('Lines only in file 2:\n')
        for line in only_in_f2:
            outfile.write(line)

注意:不同行中的相同内容被视为差异

答案 1 :(得分:0)

您可以使用套装轻松解决此问题。

set1 = set()
with open(file1) as f:
    for line in f:
        set1.add(line.strip())
#Repeat for set 2
with open(diff_file, 'w') as f:
    for line in set2 - set1:
        f.write(line + '\n')