R中的置信区间

时间:2012-09-20 18:05:27

标签: r linear-regression

我应该计算不同的置信区间,我发现在R中,我可以用predict-command做到这一点。但是我在理解我必须要做的事情时遇到了问题。我应该计算3个不同的置信区间: 1)对于回归线上的一个点 2)预测(未来)y值 3)对于整个回归线。 好的..到目前为止我做了什么:

fm <- lm(alcohol~beers)

因此,要获得整个回归线的置信区间,我会尝试:predict(fm,data.frame(beers = newbeers), level = 0.9, interval = "confidence") 但我真的不知道data.frame的作用。 好吧我知道,置信区间在90%的时间内保持实际值(这里因为0.9)。那么现在这意味着它在90%中保持最佳回归线吗? 除了关于它的一点和预测值之外,我无法理解任何意义。另外,我只知道这种计算方法,所以如何用其他两种方式计算呢?另外,我得到的输出给出了间隔的几个上限值和下限值。这是什么意思?

1 个答案:

答案 0 :(得分:3)

您在data.frame(beers = newbeers)函数中使用了predict,这意味着它是预测间隔。请注意,newbeers是一个由新数据而不是原始数据组成的数据框(用于拟合线性模型)。

对于置信区间,只需使用confint函数,它为您(默认情况下)为每个回归系数(在本例中为截距和斜率)提供95%CI。

对于回归线上的某个点,请参阅最后两张幻灯片here。单个点的置信区间必须大于回归线的置信区间。

希望这有帮助!