Question

在重复的字符串附近查找。嗨，我知道R中有一个匹配的，唯一的，重复的函数，但是我确实不需要这些函数。我的数据集中有一个唯一的列，需要检查它的数量是否几乎相同。例如，第一个元素与第二个元素相比具有几乎相同的模式，但数字“ 9”除外。第二个与第三个比较，几乎相等，除了序列中的最后一个数字，一个以6结尾，而另一个以5结尾。最后，最后两个数字100％相等。如果我使用过unique()函数，则只有最后一种情况会被正确排除。我想知道是否存在可以标记几乎相等的函数，也许计算相等的百分比，因此我可以将注意力集中在具有较高相等率的情况下。

  dat <- data.frame(text = c("87775956",
                   "987775956",
                   "987775955",
                   "987481732",
                   "987481732"))

计算几乎相等的字符串模式

0 个答案: