R中的模糊连接中文数据集

时间:2019-11-04 23:19:17

标签: r join

我正在尝试通过公司名称模糊连接两个数据集。我只需要60%的字符匹配即可匹配公司名称。问题在于公司名称全为汉字。我尝试使用difference_left_join包中的fuzzyjoin函数按公司名称连接数据集,但返回错误消息Error in v1 - v2 : non-numeric argument to binary operator。然后,我尝试使用levenshteinSim函数来查找公司名称之间的百分比匹配,但是它似乎不适用于汉字。还有其他方法可以模糊匹配公司名称并将其合并在一起吗?

0 个答案:

没有答案