我想融合3个数据框(AA
,AB
和BB
),它们包含完全相同的尺寸,并且永远不会在同一坐标中包含数字(如果包含其他数字将包含NA
。对于所有数据框,特定坐标也可以包含NA
。这是我的意见:
AA <- 'pr_id sample1 sample2 sample3
AX-1 NA 120 130
AX-2 NA NA NA
AX-3 NA NA NA'
AA <- read.table(text=AA, header=T)
AB <- 'pr_id sample1 sample2 sample3
AX-1 100 NA NA
AX-2 NA 180 NA
AX-3 NA 120 NA'
AB <- read.table(text=AB, header=T)
BB <- 'pr_id sample1 sample2 sample3
AX-1 NA NA NA
AX-2 150 NA NA
AX-3 160 NA NA'
BB <- read.table(text=BB, header=T)
我的预期输出:
Fus <- 'pr_id sample1 sample2 sample3
AX-1 100 120 130
AX-2 150 180 NA
AX-3 160 120 NA'
Fus <- read.table(text=Fus, header=T)
进行这种融合的一些想法?
答案 0 :(得分:2)
您还可以定义一个新的运算符来执行添加。
"%++%" <- Vectorize(function(x, y) {
if(is.na(x) && is.na(y)){
return(NA)
} else {
return(sum(c(x, y), na.rm=T))
}
})
cbind(AA[, 1, drop=F], matrix(as.matrix(AA[, 2:4]) %++%
as.matrix(AB[, 2:4]) %++%
as.matrix(BB[, 2:4]), ncol=3))
# pr_id 1 2 3
# 1 AX-1 100 120 130
# 2 AX-2 150 180 NA
# 3 AX-3 160 120 NA
答案 1 :(得分:1)
这是一个可能的解决方案,为您提供矩阵
L <- lapply(list(AA, AB, BB), function(x) { row.names(x) <- x[[1]]; as.matrix(x[-1])})
Reduce(function(x, y) ifelse(is.na(x), y, x), L)
如果您需要数据框:
L <- lapply(list(AA, AB, BB), function(x) { row.names(x) <- x[[1]]; as.matrix(x[-1])})
X <- Reduce(function(x, y) ifelse(is.na(x), y, x), L)
as.data.frame(X) # Fus <- as.data.frame(X)
您也可以循环执行:
L <- lapply(list(AA, AB, BB), function(x) { row.names(x) <- x[[1]]; as.matrix(x[-1])})
X <- L[[1]]
for (i in 2:length(L)) X <- ifelse(is.na(X), L[[i]], X)
X
或
L <- lapply(list(AA, AB, BB), function(x) { row.names(x) <- x[[1]]; as.matrix(x[-1])})
X <- L[[1]]
for (i in 2:length(L)) X[is.na(X)] <- L[[i]][is.na(X)]
X