手动计算Jaro距离

时间:2019-05-03 01:48:44

标签: r jaro-winkler

我正在尝试从库stringdist中验证R函数stringdist

使用示例

1 - stringdist('John J Smith', 'John Smith', method = 'jw', p = 0)返回0.9444444

p = 0表示未使用Jaro-Winkler的Winkler组件。

我正在尝试使用Wikipedia和此documentation中显示的公式来重现此结果,但是似乎无法使我的手动计算保持一致。

在下面的示例中,有5个半变位,因此floor(5/2)的结果为t = 2

有10个匹配字符,请确保匹配字符之间的距离不大于5。

enter image description here

计算结果为:

enter image description here

0 个答案:

没有答案