岭回归的置信区间

时间:2016-09-28 14:51:30

标签: r regression glmnet

我无法在岭回归中进行置信区间。我有这个模特。

model5 <- glmnet(train_x,train_y,family = "gaussian",alpha=0, lambda=0.01)

当我做预测时,我使用这些命令:

test_pred <- predict(model5, test_x, type = "link")

有人知道如何进行预测的置信区间吗?

1 个答案:

答案 0 :(得分:7)

事实证明,glmnet不提供标准错误(因此不会给出置信区间),如here所述,并且也在此vignette中解决(摘录如下) :

  

要求标准的回归错误是一个非常自然的问题   系数或其他估计量。原则上这样的标准   可以容易地计算错误,例如使用引导程序。

     

不过,这个   包故意不提供它们。原因是   对于强烈偏见,标准误差不是很有意义   估计,例如由惩罚估计方法产生。受罚   估计是一种减少估计量方差的过程   引入实质性偏见。因此,每个估计量的偏差是a   它的均方误差的主要成分,而其方差可能   只贡献一小部分。

     

不幸的是,在大多数应用程序中   惩罚回归是不可能获得足够精确的   估计偏见。任何基于bootstrap的计算都只能给出   评估估计数的方差。可靠的估计   只有在可靠无偏估计的情况下才能获得偏差   可用,通常情况并非如此   使用了惩罚估计。

     

报告a的标准错误   因此,惩罚性估计只能说明故事的一部分。它可以给   错误的精确印象,完全无视   由偏见引起的不准确。这肯定是一个错误   信心陈述仅基于对评估的评估   估计的方差,例如基于bootstrap的置信度   间隔做。

     

惩罚周围可靠的置信区间   在使用低维模型的情况下可以获得估计   标准的广义线性模型理论,以lm,glm实现   和考克斯。构建可靠置信区间的方法   据我所知,高维度的情况是不可用的。

但是,如果您坚持置信区间,请查看this帖子。