我正在尝试通过公司名称模糊连接两个数据集。我只需要60%的字符匹配即可匹配公司名称。问题在于公司名称全为汉字。我尝试使用difference_left_join
包中的fuzzyjoin
函数按公司名称连接数据集,但返回错误消息Error in v1 - v2 : non-numeric argument to binary operator
。然后,我尝试使用levenshteinSim
函数来查找公司名称之间的百分比匹配,但是它似乎不适用于汉字。还有其他方法可以模糊匹配公司名称并将其合并在一起吗?