如何使用numpy.linalg.lstsq

时间:2015-08-20 09:14:48

标签: python arrays numpy regression linear

使用numpy.linalg.lstsq运行多元线性回归后,我得到了4个数组,如文档中所述,但是我不清楚如何获得拦截值。有谁知道这个?我是统计分析的新手。

这是我的模特:

X1 = np.array(a)
X2 = np.array(b)
X3 = np.array(c)
X4 = np.array(d)
X5 = np.array(e)
X6 = np.array(f)
X1l = np.log(X1)
X2l = np.log(X2)
X3l = np.log(X3)
X6l = np.log(X6)
Y = np.array(g)

A = np.column_stack([X1l, X2l, X3l, X4, X5, X6l, np.ones(len(a), float)])
result = np.linalg.lstsq(A, Y)

这是我的模型生成的示例:

(array([  654.12744154,  -623.28893569,   276.50269246,    11.52493817,
  49.92528734,  -375.43282832,  3852.95023087]), array([  4.80339071e+11]),
  7, array([ 1060.38693842,   494.69470547,   243.14700033,   164.97697748,
  58.58072929,    19.30593045,    13.35948642]))

我认为拦截是第二个阵列,我仍然不确定,因为它的值太高了。

1 个答案:

答案 0 :(得分:3)

相交是与ones列对应的系数,在这种情况下是:

result[0][6]

为了更清楚地看到,请考虑回归,类似于:

y = c1*x1 + c2*x2 + c3*x3 + c4*x4 + m

以矩阵形式写成:

[[y1],      [[x1_1,  x2_1,  x3_1, x4_1, 1],      [[c1],
 [y2],       [x1_2,  x2_2,  x3_2, x4_2, 1],       [c2],
 [y3],  =    [x1_3,  x2_3,  x3_3, x4_3, 1],  *    [c3],
 ...                      ...                     [c4],
 [yn]]       [x1_n,  x2_n,  x3_n, x4_n, 1]]       [m]]

或:

 Y = A * C

其中A是所谓的"系数'矩阵和C包含回归解决方案的向量。请注意,m对应ones