来自回归估计的标准偏差而不是标准误差

时间:2018-07-09 19:13:50

标签: r linear-regression

背景:这是一个作为重复项被关闭然后删除的问题。我之所以看到它,是因为MetaSO上的一则帖子引起了我的注意。我认为可能已经解释了“ x和截距的标准偏差”的请求,该解释可能与任何已确定的候选重复项不同。引用内容略有修改。


这是我的数据

df<-read.table(text="x y
    10  7
    12  5
    11  4
    13  11
    13  9
    12  13
    12  12
    13  13", header=TRUE)  # fixed

我已使用此代码获取结果

fit <- lm(formula = y ~ x, data = df)

我对模型所产生的估计的(预测)标准偏差感兴趣,而不是参数估计本身的非标准误差。如何提取这些值?

1 个答案:

答案 0 :(得分:0)

我的解释是将其解释为对二维带的派生和表示的请求,该带将“捕获”或标识最接近回归线的68%点。这通常称为预测区域。通常的预测区域处于95%的水平,相当于该行的“ 2个标准偏差”,但是“水平”的简单变化从0.95变为0.68。

> pred_interval_1sd <- cbind( predict(fit,  interval="prediction",
+                          level = 0.68), df$x)
Warning message:
In predict.lm(fit, interval = "prediction", level = 0.68) :
  predictions on current data refer to _future_ responses

> pred_interval_1sd
     fit      lwr       upr   
1  5.500 1.080569  9.919431 10
2  9.250 5.572811 12.927189 12
3  7.375 3.498903 11.251097 11
4 11.125 7.248903 15.001097 13
5 11.125 7.248903 15.001097 13
6  9.250 5.572811 12.927189 12
7  9.250 5.572811 12.927189 12
8 11.125 7.248903 15.001097 13

警告:预测的结果是矩阵而不是数据框

 pred_interval_1sd <- pred_interval_1sd[ order(pred_interval_1sd[,4]),]
 plot( y ~ x, data=df)
 lines(  pred_interval_1sd[,4], pred_interval_1sd[, "upr"], col="blue", lty=3)
 lines(  pred_interval_1sd[,4], pred_interval_1sd[, "lwr"], col="blue", lty=3)

enter image description here

我想对“截距的标准偏差”还有另一种解释,我会发现这是非常有问题的,在x = 0处计算出的y尺度上,这将是68%的预测区间。