在Python中引导多个回归参数

时间:2017-04-01 00:20:14

标签: python statistics linear-regression bootstrapping statsmodels

我试图使用bootstraping来估计Python中的多个回归系数,但我无法弄清楚如何实现它。

我使用statsmodels.ols(formula =' Y~A * B * C,...)来运行单个模型。如何实现一个引导程序,它将返回这个普通最小二乘模型返回的所有参数的估计值和置信区间?

我在statsmodels中看到可能是一个bootstrap方法,但是我无法弄清楚如何导入它以及它是否具有我想要的功能。还有另一个(或几个)scikits,但同样,我无法弄清楚如何使用这些来估计许多返回的回归参数。

感谢您的帮助。我完全难过 - 而且相当新的Python。

1 个答案:

答案 0 :(得分:1)

您可以使用resample软件包,该软件包可以通过pip下载。这是Github页面:https://github.com/dsaxton/resample

doc文件夹中有一个笔记本,其中包含一个恰好解决此类问题的示例(此处我们使用sklearn,但它也可以适用于statsmodels)。本质上,您将建模过程定义为完整数据集(包括预测变量和响应变量)上的函数,该函数以您喜欢的任何格式返回模型参数(此处我们将返回包含系数和截距的字典),然后重新计算使用bootstrap模块中的resample.bootstrap引导程序样本中的函数(df是包含预测变量的pandas DataFramey }}和响应变量):

Series