R中混淆单词的名称的字符串匹配

时间:2016-03-22 13:16:32

标签: r string-matching

我正在尝试匹配R中与element(by.id("appointmentDate")).sendKeys(tomorrowDate); VISHWANATHAN KRISHNA GURUVAYUR类似的名称。删除空格后GURUVAYUR KRISHNA VISHWANATHAN会提供levenshtein匹配。 我想知道是否有一些字符串匹配算法可以将这两个名称标记为类似...

21%

1 个答案:

答案 0 :(得分:0)

尝试使用RecordLinkage包中的Jaro-Winkler算法。例如,请参阅here,有关详情,请参阅here

在你的情况下,

jarowinkler("GURUVAYURKRISHNAVISHWANATHAN","VISHWANATHANKRISHNAGURUVAYUR")

的产率:

  

0.7063492

结果总是介于0和1之间,因此这是一项改进。