使用R

时间:2016-09-22 06:49:52

标签: r string-comparison

我有一个邮件地址列表(30,000+),我想将它与自身进行比较,以便使用levenshtein distance方法找出不同之处。

所以我创建了包含相同列表的2个csv文件,我想使用adist函数,但在“简单”中使用它是不合理的。方式(因为基本上输出应该是30,000的30,000的矩阵):

有人能给我一个合适的做法吗?可能会将输出约束为3或更少(但没有相等(更改= 0) - 因为正如我所提到的那样,比较是违背自己的)

提前谢谢!

0 个答案:

没有答案