我正在使用Python中的difflib,但是我很难让输出看起来很好。出于某些奇怪的原因,difflib在每个字符前添加一个空格。例如,我有一个文件(textfile01.txt),如下所示:
测试没有意义的文本
和textfile02.txt
测试没有意义的文本
但看起来很不错
这是一个关于我如何完成比较的小代码示例:
import difflib
handle01 = open(text01.txt , 'r')
handle02 = open(text02.txt , 'r')
d = difflib.ndiff( handle01.read() , handle02.read() )
print "".join(list(diff))
然后,我看到这个丑陋的输出看起来......非常奇怪:
t t t t h h s s a o n n g g n n n g -
- b- u- t- - l-o- o- k- s- - n-i-c- e
正如您所看到的,输出看起来很糟糕。我刚刚在网上找到了基本的difflib教程,根据这些教程,输出应该看起来完全不同。我不知道我做错了什么。有什么想法吗?
答案 0 :(得分:6)
difflib.ndiff
比较字符串列表,但是你将字符串传递给它们 - 字符串实际上是一个字符列表。因此,该函数比较字符串字符。
>>> list(difflib.ndiff("test", "testa"))
[' t', ' e', ' s', ' t', '+ a']
(从字面上看,您可以通过在["t", "e", "s", "t"]
添加元素["t", "e", "s", "t", "a"]
,从列表["a"]
转到列表read()
。
您想要将readlines()
更改为"".join(...
,以便您可以按行方式比较这两个文件,这可能就是您所期望的。
您还希望将"\n".join(...
更改为diff
,以便在屏幕上获得类似>>> list(difflib.ndiff(["test"], ["testa"]))
['- test', '+ testa', '? +\n']
>>> print "\n".join(_)
- test
+ testa
? +
的输出。
?
(这里difflib非常好,并且标记了在{{1}}行中添加字符的确切位置。)