我有两个data.tables,一个有另一个的行/列子集。我想将较小的data.table的值添加到较大的值的值中:
DT1 <- as.data.table(matrix(c(0, 1, 2, 3), nrow=2, ncol=2,
dimnames=list(c("a", "b"), c("a", "b"))), keep=T)
DT2 <- as.data.table(matrix(c(0, 0, 1, 2, 2, 1, 1, 0, 3), nrow=3, ncol=3,
dimnames=list(c("a", "b", "c"), c("a", "b", "c"))), keep=T)
DT1
# rn a b
#1: a 0 2
#2: b 1 3
DT2
# rn a b c
#1: a 0 2 1
#2: b 0 2 0
#3: c 1 1 3
我想将DT1添加到DT2,以便我得到
# rn a b c
#1: a 0 4 1
#2: b 1 5 0
#3: c 1 1 3
我知道我可以很容易地用DT1覆盖DT2的值:
DT2[DT1, names(DT1) := DT1, on="rn"]
我希望像这样的东西能起作用:
DT2[DT1, names(DT1) := DT1 + .SD, on="rn"]
......但它没有。可能有一些简单的变化,但是,对吗?
答案 0 :(得分:8)
您可以使用rbindlist()
将两者组合在一起,然后根据rn
rbindlist(list(DT1, DT2), fill=TRUE)[, lapply(.SD, sum, na.rm = TRUE), by = rn]
# rn a b c
# 1: a 0 4 1
# 2: b 1 5 0
# 3: c 1 1 3
答案 1 :(得分:7)
我更喜欢理查德的方式,但这里有一个看起来更像OP最初想法的替代方案:
vs = setdiff(names(DT1),"rn")
DT2[DT1, (vs) := {
x.SD = mget(vs)
i.SD = mget(paste0("i.",vs))
Map("+", x.SD, i.SD)
}, on="rn", by=.EACHI]
# rn a b c
# 1: a 0 4 1
# 2: b 1 5 0
# 3: c 1 1 3