为模型系数创建自举置信区间

时间:2019-08-29 00:06:45

标签: r statistics-bootstrap

我正在构建一系列逐步回归(正向,反向和双向),以了解薪酬(根据Mincer方程构建)与不同学历之间的关系。所有这些模型都没有通过Durbin-Watson统计,因此我不确定估计系数的置信度。

为解决此问题,我一直在尝试使用R中的boot包来实现引导方法来生成置信区间。下面是在阅读了“ forward”模型后为“ forward”模型编写的代码示例boot中的帮助文件。

bootstrap_fwd.model<- function(data, indices, maxit=20){
  data<- data[indices,]

  mod<- step(glm(log(EAC) ~ 1,family = gaussian, na.action = na.omit, data=data, maxit=maxit, trace = FALSE ), direction = "forward",
             scope = ~ EduLevel + poly(YE, 2, raw = TRUE) + Attendance + Internship + Internship_Length + JobSearch + CS_Bach + CS_Mast + Gender + 
               Attendance * JobSearch + Attendance * CS_Bach + Attendance * CS_Mast + CS_Bach * CS_Mast + Attendance * Gender + 
               Gender * CS_Bach + Gender * CS_Mast)

coefficients(mod) #return coefficients vector
}

boot.fwd<- boot(data_simple, bootstrap_fwd.model, 500, maxit=100)

当我在一夜之间运行这段代码时,我似乎从未生成过boot.fwd

我的问题是:

  1. 这是引导参数系数周围的置信区间正确的代码吗?在定义函数方面哪里出问题了?

  2. 一旦我能够生成boot.fwd,我应该使用boot.ci函数来估计上下限吗?我将获得所有参数的置信区间吗?

  3. 输出将是什么样?应该如何解释不同的情况?

感谢您的所有帮助!

0 个答案:

没有答案