首先,公式TSS = ESS + RSS
始终正确吗?即使是指数模型?如果是这样,我就是不明白我在哪里错了。
我有2个x和y值数组,其中y取决于x。
x = np.array([1.5, 2.1, 2.4, 2.7, 3.2, 3.4, 3.6, 3.7, 4.0, 4.5, 5.1, 5.6])
y = np.array([0.6, 1.2, 1.3, 1.4, 1.45, 1.5, 1.6, 1.8, 1.9, 1.95, 2.1, 2.2])
我有一个确定系数a和b并返回线性回归方程的函数(或者如果需要,仅返回a和b)
def Linear(x, y, getAB = False):
AVG_X = np.average(x)
AVG_Y = np.average(y)
DISP_X = np.var(x)
DISP_Y = np.var(y)
STD_X = np.std(x)
STD_Y = np.std(y)
AVG_prod = np.average(x*y)
cov = AVG_prod - (AVG_X*AVG_Y)
b = cov/DISP_X
a = AVG_Y - b*AVG_X
if getAB:
return a, b
return lambda X: a + b*X
我有一个确定系数a和b并返回指数回归方程的函数
def Exponential(x, y, getAB = False):
LOG_Y_array = [math.log(value) for value in y]
A, B = Linear(x, LOG_Y_array, getAB = True)
a = math.exp(A)
b = math.exp(B)
if getAB:
return a, b
return lambda X: a * (b**X)
我创建了基于指数模型的y值计算数组
Exponential_Prediction = Exponential(x, y)
Exponential_Prediction_y = [Exponential_Prediction(value) for value in x]
最后,这就是我计算TSS,ESS和RSS的方式
TSS = np.sum((y - np.average(y))**2)
ESS_Exp = np.sum((Exponential_Prediction_y - np.average(y))**2)
RSS_Exp = np.sum((y-Exponential_Prediction_y)**2)
这很清楚,除了输出
print(str(TSS) + " = " + str(ESS_Exp) + " + " + str(RSS_Exp))
是2.18166666667 = 2.75523753042 + 0.432362713806
我不明白ESS可能不只是TSS
答案 0 :(得分:1)
在使用线性回归时,您会漏掉零项,因为不是,您必须添加它。在文斯评论的链接中,您可以看到TSS = ESS + RSS + 2 * sum((y-yhat)*(yhat-ybar))。
您需要包括这个额外的术语,以便总和:
extra_term = 2 * np.sum((y - Exponential_Prediction_y) * (Exponential_Prediction_y - y.mean()))
print(str(TSS) + " = " + str(ESS_Exp) + " + " + str(RSS_Exp) + " + " + str(extra_term))