我正在尝试对某些回归模型进行仿真研究。基本上,我将数据分为训练,验证和测试集,并执行100次重复的模拟研究。我报告了测试结果的中位数。我还想报告test-mse中位数的标准误差估计。为此,我使用具有1000个重复的引导程序,并从重复中计算出test-mse中位数的标准误差。但是,当我将我的结果与论文的结果进行比较时,我的结果似乎有很大的不同。 R
代码的草图在这里:
boot.median <- function(data, index){ # data is the vector of test-mse values from the simulations
data <- data[index]
med <- median(data)
return(med)
}
set.seed(1)
boot.tmse <- boot::boot(test.mse.medians.vector, boot.median, R=1000)
tmse.sd <- sd(boot.tmse$t)
如果我在mean(data)
函数中使用median(data)
而不是boot.median
,则会获得与纸张更接近的tmse.sd
值。
我有一个错误吗?