如何使用回归分析来识别相关性

时间:2016-10-22 17:35:00

标签: machine-learning regression correlation

我有两个变量Price和Distance,并想知道两者之间是否存在相关性以及统计上的重要性。

我使用最小二乘法在python中创建了一个线性模型,但我不知道如何从中得出任何相关度量。

谢谢,

2 个答案:

答案 0 :(得分:0)

如果我们讨论的是使用一个预测变量进行简单回归,那么您可以从回归输出中推导出相关性。有两种方法。首先,简单地取R平方统计量的平方根。当然,由于它是R- 平方,我们不确定相关性是正还是负。那么,看看β系数的符号。如果它是负数,你知道相关性也是负数。或者,您可以将β系数除以标准差的比率。

formula

所以,

formula

然后,您可以将r转换为t统计量,以确定它是否显着。

答案 1 :(得分:-1)

为了找到两个变量之间的相关性,最好的方法是为两个变量做一个散点图。散点图可以让您直观了解变量的相关性。       Scatter plot

还有另一种方法可以通过使用seaborn库绘制热图来检查相关性。 seaborn热图看起来像这样,带有不同变量的相关值。

enter image description here