如您所知,使用CORRB选项,您可以在SAS中进行逻辑回归或线性回归,以输出估计矩阵的相关性。有趣的是,我不知道如何阅读这个矩阵。我有两个明显强烈正相关的变量。从PROC CORR,我可以看出这两个变量的皮尔森相关系数是0.7+。但是,逻辑回归和线性回归的估计矩阵给出了-0.7。相关性的强度大致相似,但符号相反。有人可以解释一下吗?非常感谢。
答案 0 :(得分:3)
您正在正确阅读这些值,它们只是意味着不同的东西。 PROC CORR为您提供变量的相关性,而CORRB是模型中这些变量系数的相关性。
这是一个直观的解释,为什么正相关预测因子将具有负相关系数。假设y = a + b1*x1 + b2*x2 + eps
。如果将b1
与从回归中获得的最佳值稍微增加一点,那么y
的预测值也会增加(对于正x1
)并且会使整体适应性变差。一种补偿方法并将预测值移近观察值的方法是降低 b2
:因为x1
的高值与{{1}的高值相关联,你将回到接近原始的契合。这表明x2
中的不确定性与b2
中的不确定性呈负相关:增加一个而减少另一个将导致类似的拟合。
看一下完美相关的极端情况可能是有益的:b1
。然后,以下内容将为您提供完全相同的预测:
x2=x1
所以y = 1 + 2*x + 3*x
y = 1 + 3*x + 2*x
y = 1 + 9*x + (-4)*x
etc
和系数具有完美的负相关性。