用numpy lstsq计算残差

时间:2015-01-26 17:53:52

标签: python numpy

我有x,y数据:

import numpy as np
x = np.array([ 2.5, 1.25, 0.625, 0.3125, 0.15625, 0.078125])
y = np.array([ 2448636.,1232116.,617889.,310678.,154454.,78338.])

X = np.vstack((x, np.zeros(len(x))))
popt,res,rank,val = np.linalg.lstsq(X.T,y)
popt,res,rank,val

给我:

(array([ 981270.29919414,       0.        ]),
 array([], dtype=float64),
 1,
 array([ 2.88639894,  0.        ]))

为什么残差为零?如果我添加一个而不是零,则计算残差:

X = np.vstack((x, np.ones(len(x)))) # added ones instead of zeros
popt,res,rank,val = np.linalg.lstsq(X.T,y)
popt,res,rank,val

(array([ 978897.28500355,    4016.82089552]),
array([ 42727293.12864216]),
2,
array([ 3.49623683,  1.45176681]))

此外,如果我计算excel中的残差平方和,如果截距设置为零,则获得9261214;如果将截距设置为x,则获得5478137

1 个答案:

答案 0 :(得分:2)

lstsq将很难适应该列零:相应参数的任何值(可能是拦截)都可以。

要将截距固定为0,如果您需要执行此操作,只需发送x数组,但请确保它是lstsq的正确形状:

In [214]: popt,res,rank,val = np.linalg.lstsq(np.atleast_2d(x).T,y)
In [215]: popt
Out[215]: array([ 981270.29919414])
In [216]: res
Out[216]: array([ 92621214.2278382])