我有以下代码
set.seed(30)
nsim <- 50 ## NUMBER OF REPLICATIONS
demand <- c(12,13,24,12,13,12,14,10,11,10)
res <- replicate(nsim, {
load <- runif(10,11,14)
diff <- load - demand ## DIFFERENCE BETWEEN DEMAND AND LOAD
return(sum(diff < 0))
})
res
[1] 6 5 7 4 4 5 4 3 6 4 5 5 5 4 2 5 3 3 3 5 3 2 4 6 5 4 4 3 5 6 4 4 3 6 5 3 5 5 4 3 3
[42] 6 4 4 4 6 6 5 4 5
我有一个庞大的数据集,问题是计算每次复制的平均值的最快方法是什么。例如,第一次复制中的res为6,因此结果应为6/1 = 6,第二次为6 + 5/2 = 5.5为第三次6 + 5 + 7/3 = 6,最后一次复制为sum(res )/nsim=4.38
答案 0 :(得分:2)
为了说明我的评论,您可以生成一个矩阵,其中列(或行,如果您愿意)代表复制,之后您可以使用R的矩阵运算功能:
set.seed(47) # make reproducible
nsim <- 50 ## NUMBER OF REPLICATIONS
demand <- c(12,13,24,12,13,12,14,10,11,10)
loads <- matrix(runif(10 * nsim, 11, 14), ncol = nsim)
diffs <- loads - demand # with vector recycling
# or: diffs <- apply(loads, 2, `-`, demand)
# or: diffs <- apply(loads, 2, function(x){x - demand})
res <- colSums(diffs > 0)
LOLE <- sum(res) / nsim
LOLE
#> [1] 5.7
答案 1 :(得分:2)
在问题的编辑版本(2月11日5:53编辑)中,OP指定了预期结果。这些表明OP可能正在寻找结果向量res
的累积平均值:
cumsum(res)/seq_along(res)
# [1] 6.000000 5.500000 6.000000 5.500000 5.200000 5.166667 5.000000 4.750000 4.888889
#[10] 4.800000 4.818182 4.833333 4.846154 4.785714 4.600000 4.625000 4.529412 4.444444
#[19] 4.368421 4.400000 4.333333 4.227273 4.217391 4.291667 4.320000 4.307692 4.296296
#[28] 4.250000 4.275862 4.333333 4.322581 4.312500 4.272727 4.323529 4.342857 4.305556
#[37] 4.324324 4.342105 4.333333 4.300000 4.268293 4.309524 4.302326 4.295455 4.288889
#[46] 4.326087 4.361702 4.375000 4.367347 4.380000
或者,可以使用dplyr::cummean(res)
。