计算几乎相等的字符串模式

时间:2018-08-07 15:22:45

标签: r

在重复的字符串附近查找。嗨,我知道R中有一个匹配的,唯一的,重复的函数,但是我确实不需要这些函数。我的数据集中有一个唯一的列,需要检查它的数量是否几乎相同。例如,第一个元素与第二个元素相比具有几乎相同的模式,但数字“ 9”除外。第二个与第三个比较,几乎相等,除了序列中的最后一个数字,一个以6结尾,而另一个以5结尾。最后,最后两个数字100%相等。如果我使用过unique()函数,则只有最后一种情况会被正确排除。 我想知道是否存在可以标记几乎相等的函数,也许计算相等的百分比,因此我可以将注意力集中在具有较高相等率的情况下。

  dat <- data.frame(text = c("87775956",
                   "987775956",
                   "987775955",
                   "987481732",
                   "987481732"))

0 个答案:

没有答案