在agrep函数中重复

时间:2019-02-18 09:20:31

标签: r agrep

我有以下代码:

x <- data.frame("SN" = 1:2, "Name" = c("aaa","bbb"))

y <- data.frame("SN" = 1:2,  "Name" = c("aa1","aa2"))

x$partials<- as.character(sapply(x$Name, agrep, y$Name,max.distance = 1,value=T))

x

输出如下:

    > x
  SN Name        partials
1  1  aaa c("aa1", "aa2")
2  2  bbb    character(0)

但是我期望以下输出:

enter image description here

有什么想法吗?

1 个答案:

答案 0 :(得分:2)

您可能正在寻找这个。

首先,如果sapply()character(0)不输出任何内容。为防止这种情况,如果您确实要这么做,可以说是NA或文本"character(0)"

z <- setNames(sapply(x$Name, function(a) {
  ag <- agrep(a, y$Name, max.distance=1, value=TRUE)
  if (identical(ag, character(0))) NA  # set to "character(0)" at will
  else ag
  }), x$Name)

然后,将得到的列表转换成矩阵。

z <- do.call(rbind, z)

我们需要melt()以获得正确的格式。一个不错的方法是使用data.table

library(data.table)
z <- setNames(melt(z)[-2], c("Name", "partials"))

现在,我们仅将x与新数据合并即可得到结果,从而确保z的唯一行。

res <- merge(x, unique(z))[c(2, 1, 3)]

> res
  SN Name partials
1  1  aaa      aa1
2  1  aaa      aa2
3  2  bbb     <NA>