SequenceMatcher比率()

时间:2014-06-04 19:29:43

标签: python diff difflib

我打算用SequenceMatcher(...).ratio()检查两个字符串是否相似。但是,我的快速测试表明我没有预料到(并且这不符合我的目的):

>>> SequenceMatcher(None, 'abqab', 'abcab').ratio()
0.8
>>> SequenceMatcher(None, 'abqabc', 'abcabc').ratio()
0.5

具有相同错误数量的较长字符串应具有相同或更低的比率,对吗?

1 个答案:

答案 0 :(得分:0)

abc和abq只有3个字母,几乎匹配所以这是正确的。不同的字符串会按预期执行。

>>> SequenceMatcher(None, 'abqdef', 'abcdef').ratio()
0.83333333333333337