如何计算python中字符串中的字符匹配?

时间:2015-01-12 15:22:14

标签: python string matching

例如:

String 1: Can We Live (feat. Cece Rogers) [Joke Instrumental Mix] 
String 2: Can We Live (feat. Cece Rogers) Joke Instrumental Mix 

 Match count = 53

请阅读:Character match count between strings in perl

希望以蟒蛇的方式做到这一点。

1 个答案:

答案 0 :(得分:1)

要回答标题中提出的问题,您可以获得两个字符串中匹配字符数的计数:

In [1]: s1 = 'Can We Live (feat. Cece Rogers) [Joke Instrumental Mix]'
In [2]: s2 = 'Can We Live (feat. Cece Rogers) Joke Instrumental Mix'

In [3]: if len(s1) > len(s2):     # swap strings so that s1 is shortest
   .....:     s1, s2 = s2, s1
   .....:     

In [4]: sum(c1==s2[i] for i, c1 in enumerate(s1))
Out[4]: 32

但是,对于您的目的而言,这可能不是一个足够好的相似度量。如果是这种情况,请查看Levenshtein distance及其在distance module中的实现。

编辑:@Veedrac完全正确:没有交换的更简单的单行解决方案是:

sum(c1 == c2 for c1, c2 in zip(s1, s2))

zip忽略较长序列中的项目。)