假设我有一个值为
的数据框Mtemp:
-----+
code |
-----+
Ram |
John |
Tracy|
Aman |
我想将它与数据帧进行比较 M2:
------+
code |
------+
Vivek |
Girish|
Rum |
Rama |
Johny |
Stacy |
Jon |
我想获得结果,以便对于Mtemp中的每个值,我将在Levensthein距离2的M2中获得最多2个可能的匹配。
我用过
tp<-as.data.frame(amatch(Mtemp$code,M2$code,method = "lv",maxDist = 2))
tp$orig<-Mtemp$code
colnames(tp)<-c('Res','orig')
我得到的结果如下
Res |orig
-----+-----
3 |Ram
5 |John
6 |Tracy
4 |Aman
请让我知道如何获得每个Mtemp字符串的2个值(如果可能),Lev距离= 2