背景:这是一个作为重复项被关闭然后删除的问题。我之所以看到它,是因为MetaSO上的一则帖子引起了我的注意。我认为可能已经解释了“ x和截距的标准偏差”的请求,该解释可能与任何已确定的候选重复项不同。引用内容略有修改。
这是我的数据
df<-read.table(text="x y
10 7
12 5
11 4
13 11
13 9
12 13
12 12
13 13", header=TRUE) # fixed
我已使用此代码获取结果
fit <- lm(formula = y ~ x, data = df)
我对模型所产生的估计的(预测)标准偏差感兴趣,而不是参数估计本身的非标准误差。如何提取这些值?
答案 0 :(得分:0)
我的解释是将其解释为对二维带的派生和表示的请求,该带将“捕获”或标识最接近回归线的68%点。这通常称为预测区域。通常的预测区域处于95%的水平,相当于该行的“ 2个标准偏差”,但是“水平”的简单变化从0.95变为0.68。
> pred_interval_1sd <- cbind( predict(fit, interval="prediction",
+ level = 0.68), df$x)
Warning message:
In predict.lm(fit, interval = "prediction", level = 0.68) :
predictions on current data refer to _future_ responses
> pred_interval_1sd
fit lwr upr
1 5.500 1.080569 9.919431 10
2 9.250 5.572811 12.927189 12
3 7.375 3.498903 11.251097 11
4 11.125 7.248903 15.001097 13
5 11.125 7.248903 15.001097 13
6 9.250 5.572811 12.927189 12
7 9.250 5.572811 12.927189 12
8 11.125 7.248903 15.001097 13
警告:预测的结果是矩阵而不是数据框
pred_interval_1sd <- pred_interval_1sd[ order(pred_interval_1sd[,4]),]
plot( y ~ x, data=df)
lines( pred_interval_1sd[,4], pred_interval_1sd[, "upr"], col="blue", lty=3)
lines( pred_interval_1sd[,4], pred_interval_1sd[, "lwr"], col="blue", lty=3)
我想对“截距的标准偏差”还有另一种解释,我会发现这是非常有问题的,在x = 0处计算出的y尺度上,这将是68%的预测区间。