我有一个文件路径列表。对于每个列表元素,我添加了两个字符串A和B,使得文件的绝对路径为:file1 = A + listelemet和file2 = B + listelement。我需要检查文件是否相同。如果相同,请忽略。如果不是相同的打印行号,则显示给定行号的这些行的比较。
我试过这样的事情:
with open(file1, 'r') as filea:
with open(file2, 'r') as fileb:
diff = difflib.unified_diff(filea.readlines(),fileb.readlines(),fromfile=os.path.basename(file1),tofile=os.path.basename(file2))
for line in diff:
sys.stdout.write(line)
但它没有为每个文件中的每个行号提供合并输出
假设我有一个文本文件:
a
s
s
s
d
ssasa
和另一个具有以下内容:
a
s
d
ere
ewrwer
werewr
我得到的输出为:
--- asd.txt
+++ asd1.txt
@@ -1,11 +1,8 @@
a
s
-s
-s
d
+ere
+ewrwer
-
-
-
-ssasa+werewr
但是,我需要输出打印的行号,然后是每行文件的行差异
控制台中的所需输出:
Comparing files file1 and file2
3: file1:s,file2:d
4: file1:s, file2:ere
5: file1:d
6: file2:ewrwer
8: file2:werewr
11: file1:ssasa
答案 0 :(得分:2)
根据您想要的输出,您可能更喜欢使用filecmp
和以下函数:
import filecmp
from itertools import izip_longest
def file_differences(file1, file2):
with open(file1, 'r') as f1, open(file2, 'r') as f2:
for i, lines in enumerate(izip_longest(f1.readlines(), f2.readlines(), fillvalue='')):
lines = map(lambda s: s.rstrip(), lines)
if lines[0] != lines[1]:
out = []
for f, line in zip((file1, file2), lines):
s = f + ': ' + line if line else ''
out.append(s)
sep = ', ' if out[0] and out[1] else ''
string = out[0] + sep + out[1]
print('{0}: {1}'.format(i+1, string))
if not filecmp.cmp('file1.txt', 'file2.txt'):
file_differences('file1.txt', 'file2.txt')