统计模型的OLS不适用于反比例数据?

时间:2014-07-13 13:47:32

标签: python statistics regression linear-regression statsmodels

我正在尝试使用一些反比例数据执行普通最小二乘回归,但似乎拟合结果是错误的?

import statsmodels.formula.api as sm
import numpy as np
import matplotlib.pyplot as plt

y = np.arange(100, 0, -1)
x = np.arange(0, 100)

result = sm.OLS(y, x).fit()
fig, ax = plt.subplots(nrows=1, ncols=1, figsize=(20, 4), sharey=True)
ax.plot(x, result.fittedvalues, 'r-')
ax.plot(x, y, 'x')

fig.show()

plot

1 个答案:

答案 0 :(得分:1)

您并未将documentation suggests添加为常量,因此它试图将整个事件视为y = m x。最后得到的m约为0.5,因为它可以做到最好,因为你必须在0时为0,等等。

以下代码(请注意导入中的更改)

import statsmodels.api as sm
import numpy as np
import matplotlib.pyplot as plt

y = np.arange(100, 0, -1)
x = np.arange(0, 100)
x = sm.add_constant(x)

result = sm.OLS(y, x).fit()
fig, ax = plt.subplots(nrows=1, ncols=1, figsize=(10, 8), sharey=True)
ax.plot(x[:,1], result.fittedvalues, 'r-')
ax.plot(x[:,1], y, 'x')

plt.savefig("out.png")

产生

plot showing the match

系数为[ 100. -1.]