我知道我可以使用cmp,diff等来比较两个文件,但我要找的是一个实用程序,它给出了两个文件之间的百分比差异。
如果没有这样的实用程序,任何算法都可以做得很好。我读过有关模糊编程的内容,但我还不太了解它。
答案 0 :(得分:32)
您可以使用difflib.SequenceMatcher ratio方法
来自文档:
返回一个指标 序列的相似性作为浮点数 范围[0,1]。
例如:
from difflib import SequenceMatcher
text1 = open(file1).read()
text2 = open(file2).read()
m = SequenceMatcher(None, text1, text2)
m.ratio()
答案 1 :(得分:3)
看起来Linux有一个名为dwdiff的实用程序可以通过使用“-s”标志来提供百分比差异
答案 2 :(得分:1)
Beyond Compare将非常好的文件差异统计信息导出到csv。报告了行级别的差异,因此比较源代码文件很好。