我想学习数据框架的多元线性回归模型。下面是演示代码。互联网上的每个地方我都只能找到这样的代码,其中目标变量可以用其他变量学习,但是在完整的数据集上。我没有特别发现k-fold交叉验证设置优选直接函数作为ols方法的参数。
然而,我确实在scikit-learn库中找到了回归方法中的交叉验证设置,但我想知道为什么不使用statsmodels。
import statsmodels.formula.api as sm
import pandas
假设数据采用.csv格式并使用pandas读取(因此,采用数据帧格式)。
mod = sm.ols(formula='Target_Var ~ var_1 + var_2 + var_3', data=df)
res = mod.fit()
print res.summary()