比较列表中的文件

时间:2018-05-08 09:31:10

标签: python python-2.7

我有一个文件路径列表。对于每个列表元素,我添加了两个字符串A和B,使得文件的绝对路径为:file1 = A + listelemet和file2 = B + listelement。我需要检查文件是否相同。如果相同,请忽略。如果不是相同的打印行号,则显示给定行号的这些行的比较。

我试过这样的事情:

with open(file1, 'r') as filea:
    with open(file2, 'r') as fileb:
        diff = difflib.unified_diff(filea.readlines(),fileb.readlines(),fromfile=os.path.basename(file1),tofile=os.path.basename(file2))
        for line in diff:
            sys.stdout.write(line)

但它没有为每个文件中的每个行号提供合并输出

假设我有一个文本文件:

a
s
s
s
d





ssasa

和另一个具有以下内容:

a
s
d
ere

ewrwer

werewr

我得到的输出为:

--- asd.txt
+++ asd1.txt
@@ -1,11 +1,8 @@
 a
 s
-s
-s
 d
+ere

+ewrwer

-
-
-
-ssasa+werewr

但是,我需要输出打印的行号,然后是每行文件的行差异

控制台中的所需输出:

Comparing files file1 and file2


    3:  file1:s,file2:d
    4:  file1:s, file2:ere
    5:  file1:d
    6:  file2:ewrwer
    8:  file2:werewr
   11:  file1:ssasa

1 个答案:

答案 0 :(得分:2)

根据您想要的输出,您可能更喜欢使用filecmp和以下函数:

import filecmp
from itertools import izip_longest

def file_differences(file1, file2):
    with open(file1, 'r') as f1, open(file2, 'r') as f2:
        for i, lines in enumerate(izip_longest(f1.readlines(), f2.readlines(), fillvalue='')):
            lines = map(lambda s: s.rstrip(), lines)
            if lines[0] != lines[1]:
                out = []
                for f, line in zip((file1, file2), lines):
                    s = f + ': ' + line if line else ''
                    out.append(s)
                sep = ', ' if out[0] and out[1] else ''
                string = out[0] + sep + out[1]
                print('{0}: {1}'.format(i+1, string))


if not filecmp.cmp('file1.txt', 'file2.txt'):
    file_differences('file1.txt', 'file2.txt')