标签: r string-matching
我正在尝试匹配R中与element(by.id("appointmentDate")).sendKeys(tomorrowDate); 和VISHWANATHAN KRISHNA GURUVAYUR类似的名称。删除空格后GURUVAYUR KRISHNA VISHWANATHAN会提供levenshtein匹配。 我想知道是否有一些字符串匹配算法可以将这两个名称标记为类似...
element(by.id("appointmentDate")).sendKeys(tomorrowDate);
VISHWANATHAN KRISHNA GURUVAYUR
GURUVAYUR KRISHNA VISHWANATHAN
levenshtein
21%
答案 0 :(得分:0)
尝试使用RecordLinkage包中的Jaro-Winkler算法。例如,请参阅here,有关详情,请参阅here。
在你的情况下,
jarowinkler("GURUVAYURKRISHNAVISHWANATHAN","VISHWANATHANKRISHNAGURUVAYUR")
的产率:
0.7063492
结果总是介于0和1之间,因此这是一项改进。