在重复的字符串附近查找。嗨,我知道R中有一个匹配的,唯一的,重复的函数,但是我确实不需要这些函数。我的数据集中有一个唯一的列,需要检查它的数量是否几乎相同。例如,第一个元素与第二个元素相比具有几乎相同的模式,但数字“ 9”除外。第二个与第三个比较,几乎相等,除了序列中的最后一个数字,一个以6结尾,而另一个以5结尾。最后,最后两个数字100%相等。如果我使用过unique()
函数,则只有最后一种情况会被正确排除。
我想知道是否存在可以标记几乎相等的函数,也许计算相等的百分比,因此我可以将注意力集中在具有较高相等率的情况下。
dat <- data.frame(text = c("87775956",
"987775956",
"987775955",
"987481732",
"987481732"))