测试集上的均方误差的标准偏差估计

时间:2019-12-12 13:37:50

标签: r median statistics-bootstrap mse

我正在尝试对某些回归模型进行仿真研究。基本上,我将数据分为训练,验证和测试集,并执行100次重复的模拟研究。我报告了测试结果的中位数。我还想报告test-mse中位数的标准误差估计。为此,我使用具有1000个重复的引导程序,并从重复中计算出test-mse中位数的标准误差。但是,当我将我的结果与论文的结果进行比较时,我的结果似乎有很大的不同。 R代码的草图在这里:

boot.median <- function(data, index){ # data is the vector of test-mse values from the simulations
  data <- data[index]
  med <- median(data)
  return(med)
}

set.seed(1)
boot.tmse <- boot::boot(test.mse.medians.vector, boot.median, R=1000)
tmse.sd <- sd(boot.tmse$t)

如果我在mean(data)函数中使用median(data)而不是boot.median,则会获得与纸张更接近的tmse.sd值。

我有一个错误吗?

0 个答案:

没有答案