将dfs与相同的dimmensions融合

时间:2016-01-27 11:37:19

标签: r na fusion

我想融合3个数据框(AAABBB),它们包含完全相同的尺寸,并且永远不会在同一坐标中包含数字(如果包含其他数字将包含NA。对于所有数据框,特定坐标也可以包含NA。这是我的意见:

AA <- 'pr_id  sample1  sample2 sample3
            AX-1   NA       120     130    
            AX-2   NA       NA     NA
            AX-3   NA       NA     NA'
AA <- read.table(text=AA, header=T)

AB <- 'pr_id  sample1  sample2 sample3
            AX-1   100       NA     NA    
            AX-2   NA       180     NA
            AX-3   NA       120     NA'
AB <- read.table(text=AB, header=T)

BB <- 'pr_id  sample1  sample2 sample3
            AX-1   NA       NA     NA    
            AX-2   150       NA     NA
            AX-3   160       NA     NA'
BB <- read.table(text=BB, header=T) 

我的预期输出:

Fus <- 'pr_id  sample1  sample2 sample3
            AX-1   100       120     130    
            AX-2   150       180     NA
            AX-3   160       120     NA'
Fus <- read.table(text=Fus, header=T)

进行这种融合的一些想法?

2 个答案:

答案 0 :(得分:2)

您还可以定义一个新的运算符来执行添加。

"%++%" <- Vectorize(function(x, y) {
  if(is.na(x) && is.na(y)){
    return(NA)
  } else {
    return(sum(c(x, y), na.rm=T))
  }
})

cbind(AA[, 1, drop=F], matrix(as.matrix(AA[, 2:4]) %++% 
                                as.matrix(AB[, 2:4]) %++% 
                                as.matrix(BB[, 2:4]), ncol=3))
#   pr_id   1   2   3
# 1  AX-1 100 120 130
# 2  AX-2 150 180  NA
# 3  AX-3 160 120  NA

答案 1 :(得分:1)

这是一个可能的解决方案,为您提供矩阵

L <- lapply(list(AA, AB, BB), function(x) { row.names(x) <- x[[1]]; as.matrix(x[-1])})
Reduce(function(x, y) ifelse(is.na(x), y, x), L)

如果您需要数据框:

L <- lapply(list(AA, AB, BB), function(x) { row.names(x) <- x[[1]]; as.matrix(x[-1])})
X <- Reduce(function(x, y) ifelse(is.na(x), y, x), L)
as.data.frame(X)  # Fus <- as.data.frame(X)

您也可以循环执行:

L <- lapply(list(AA, AB, BB), function(x) { row.names(x) <- x[[1]]; as.matrix(x[-1])})
X <- L[[1]]
for (i in 2:length(L)) X <- ifelse(is.na(X), L[[i]], X)
X

L <- lapply(list(AA, AB, BB), function(x) { row.names(x) <- x[[1]]; as.matrix(x[-1])})
X <- L[[1]]
for (i in 2:length(L)) X[is.na(X)] <- L[[i]][is.na(X)]
X