惩罚线性回归的预测区间

时间:2019-10-27 08:35:21

标签: python machine-learning scikit-learn statsmodels lasso-regression

背景: 我正在运行单变量线性回归模型(OLS),并输出Y_hat的预测间隔。线性模型到目前为止最适合我的任务,因为它提供了所需的可解释性,同时又简单又快速。

但是,现在,更多的预测变量将进入模型(仍然保持n> p),由于其中一些可能高度相关,因此我正在研究使用惩罚线性模型,同时仍然能够输出Y_hat的预测间隔。

我的预测变量集并不大(对于300个观察值,小于15-20)。

问题: 我意识到,由于估算值存在偏差(例如,根据https://stats.stackexchange.com/questions/121993/elastic-net-confidence-intervals-for-parameters和第18页,https://cran.r-project.org/web/packages/penalized/vignettes/penalized.pdf,因为估计值有偏差,所以对脊/弹性网/ LASSO的预测间隔并不像OLS中那样简单)

但是我想知道是否可以使用一些已经实施的(至少是部分的)解决方案(特别是Python软件包)?如果不是那样,那么至少应该对如何处理这类问题的一些一般性准则表示赞赏。

谢谢

0 个答案:

没有答案