我正在尝试从库stringdist
中验证R函数stringdist
。
使用示例
1 - stringdist('John J Smith', 'John Smith', method = 'jw', p = 0)
返回0.9444444
p = 0
表示未使用Jaro-Winkler的Winkler组件。
我正在尝试使用Wikipedia和此documentation中显示的公式来重现此结果,但是似乎无法使我的手动计算保持一致。
在下面的示例中,有5个半变位,因此floor(5/2)
的结果为t = 2
。
有10个匹配字符,请确保匹配字符之间的距离不大于5。
计算结果为: