Levensthein逻辑以获得最小差异的所有字符串

时间:2017-05-19 07:06:42

标签: r levenshtein-distance

假设我有一个值为

的数据框
Mtemp:
-----+
code |
-----+
Ram  |
John |
Tracy|
Aman |

我想将它与数据帧进行比较 M2:

------+
code  |
------+
Vivek |
Girish|
Rum   |
Rama  |
Johny |
Stacy |
Jon   |

我想获得结果,以便对于Mtemp中的每个值,我将在Levensthein距离2的M2中获得最多2个可能的匹配。

我用过

tp<-as.data.frame(amatch(Mtemp$code,M2$code,method = "lv",maxDist = 2))
tp$orig<-Mtemp$code
colnames(tp)<-c('Res','orig')

我得到的结果如下

Res  |orig  
-----+-----
3    |Ram
5    |John
6    |Tracy
4    |Aman

请让我知道如何获得每个Mtemp字符串的2个值(如果可能),Lev距离= 2

0 个答案:

没有答案