我正在尝试创建一个矩阵,其中每一行由另一个矩阵中每三行的总和组成。实际上列表中有一堆这样的矩阵,我对该列表中的每个元素执行相同的操作。基于此post,我能够生成以下代码。它可以工作,但对于我更复杂的数据集,它需要永远。
test<-lapply(1:1000, function(x) matrix(1:300, nrow=60))
testCons<-lapply(test, function(x) apply(x, 2, function(y) tapply(y, ceiling(seq_along(y)/3), sum)))
有没有人知道如何提高速度或简化它?
答案 0 :(得分:4)
rowsum
提供了一个简单的加速 - 它根据分组变量计算行的总和,该变量是每三行的索引。
test <- lapply(1:1000, function(x) matrix(1:300, nrow=60))
system.time(
testCons <- lapply(test, function(x) apply(x, 2, function(y) tapply(y, ceiling(seq_along(y)/3), sum)))
)
# user system elapsed
# 1.672 0.004 1.678
system.time(
testCons2 <- lapply(test, function(x) rowsum(x, rep(seq_len(nrow(x) / 3), each=3)))
)
# user system elapsed
# 0.08 0.00 0.08
all.equal(testCons, testCons2)
#[1] TRUE