difflib输出很奇怪,在每个字符上添加额外的空格

时间:2015-01-16 22:38:57

标签: python difflib

我正在使用Python中的difflib,但是我很难让输出看起来很好。出于某些奇怪的原因,difflib在每个字符前添加一个空格。例如,我有一个文件(textfile01.txt),如下所示:

  

测试没有意义的文本

和textfile02.txt

  

测试没有意义的文本

     

但看起来很不错

这是一个关于我如何完成比较的小代码示例:

import difflib

handle01 = open(text01.txt , 'r')
handle02 = open(text02.txt , 'r')

d = difflib.ndiff( handle01.read() , handle02.read() )
print "".join(list(diff))

然后,我看到这个丑陋的输出看起来......非常奇怪:

  

t t t t h h s s a o n n g g n n n g -

     

- b- u- t- - l-o- o- k- s- - n-i-c- e

正如您所看到的,输出看起来很糟糕。我刚刚在网上找到了基本的difflib教程,根据这些教程,输出应该看起来完全不同。我不知道我做错了什么。有什么想法吗?

1 个答案:

答案 0 :(得分:6)

difflib.ndiff比较字符串列表,但是你将字符串传递给它们 - 字符串实际上是一个字符列表。因此,该函数比较字符串字符。

>>> list(difflib.ndiff("test", "testa"))
['  t', '  e', '  s', '  t', '+ a']

(从字面上看,您可以通过在["t", "e", "s", "t"]添加元素["t", "e", "s", "t", "a"],从列表["a"]转到列表read()

您想要将readlines()更改为"".join(...,以便您可以按行方式比较这两个文件,这可能就是您所期望的。

您还希望将"\n".join(...更改为diff,以便在屏幕上获得类似>>> list(difflib.ndiff(["test"], ["testa"])) ['- test', '+ testa', '? +\n'] >>> print "\n".join(_) - test + testa ? + 的输出。

?

(这里difflib非常好,并且标记了在{{1}}行中添加字符的确切位置。)