Jaro相似度

时间:2015-11-24 05:43:04

标签: similarity jaro-winkler

为了找到Jaro的相似性,我发现匹配的字符如下

matching charecters in string 1 :  AABABCAAAC   
matching charecters in string 2 :  ABAACBAAAC

t(0.5 *换位)的值是多少? (来源:维基百科)

1 个答案:

答案 0 :(得分:1)

此上下文中的换位是与字符串上的相同位置不匹配的所有字符

来自wikipedia

m = 10
t = 4/2 = 2
|S1| = 10
|S2| = 10
d = 1/3 * (10/10 + 10/10 + (10-2)/10) = 0.933

这些转置是[A / B,B / A,B / C,C / B]所以t是用|[A/B, B/A, B/C, C/B]| / 2计算的。