岭回归与OLS回归略有不同。在数学上,OLS回归使用公式
其中岭回归使用公式
我想使用岭回归来避免多重性,但是得到了非常奇怪的结果,这比使用回归()简单得多。在matlab中,要调用函数岭,必须输入X,Y和k的值。理论上,如果k设置为零,这些方程应该是相同的;但是当我在代码中背靠背调用它们时,使用相同的X和Y值,我会收到两个非常不同的B矩阵(如下所示)。有人可以解释为什么会这样吗?
b_ridge = ridge(Y_current,X, 0)
12.4525
9.0099
0.2808
-1.5426
-1.1107
b_regress = regress(Y_current,X)
3.5586
0.8805
0.1670
-0.3934
-0.8526
答案 0 :(得分:4)
根据ridge
文件:
在对
x
列进行居中和缩放后计算结果,使它们的平均值为0,标准差为1。
以下是使用列向量的示例:
>> x = randn(5,1);
>> y = randn(5,1);
>> ridge(y, x, 0)
ans =
-0.045681220595243
>> regress(y, x)
ans =
-0.028738686366027
>> regress(y, (x-mean(x))/std(x))
ans =
-0.045681220595243