据我了解,回归方程可以通过以下函数计算:
import statsmodels.formula.api as smf
fg = smf.ols(formula='X ~ Y', data=data).fit()
我们也可以从numpy polyfit函数计算出来。
numpy.polyfit(x, y, degree)
因为我们可以改变numpy polyfit的程度。
在ols函数中,我们还可以添加其他自变量,如下所示:
fg = smf.ols(formula='X ~ Y+Y1+Y2', data=data).fit()
所以我的问题是我们可以改变ols功能的顺序/适合度吗? 或者我们可以在numpy polyfit函数中添加另一个自变量吗?
答案 0 :(得分:2)
对于您提到的statsmodels能力,使用patsy语言指定公式(请参阅http://patsy.readthedocs.io/en/latest/)。因此,例如,您使用的第一次调用可能是以下内容。
fg = smf.ols(formula='X ~ Y + Y**2', data=data).fit()
或
fg = smf.ols(formula='X ~ log(Y)', data=data).fit()