反转X和Y时的奇怪的abline行为

时间:2014-04-11 21:28:58

标签: r statistics linear-regression

我正在尝试使用2个变量WMC和BUG进行回归线

当BUG是X轴时,回归线看起来很完美。 然而,当BUG是Y轴而WMC是X轴时,该线表现得很奇怪,它似乎根本不适合该情节。我做错了什么?

reg1 <- lm (WMC ~ BUG)
plot(BUG,WMC)
abline(reg1)

plot1 http://i57.tinypic.com/2lu305y.png

reg1 <- lm (BUG ~ WMC)
plot(WMC,BUG)
abline(reg1)

plot2 http://i57.tinypic.com/efexdf.png

是的,我是统计数据菜鸟。

1 个答案:

答案 0 :(得分:1)

暂时忽略模型的基本原理:如何绘制线条没有任何问题。线条看起来与图形不同的原因是因为您估计了两种不同的模型。

因此,让我们从您的第一个模型开始,在wmc上对bug进行回归

m1<-lm(wmc~bug,df);summary(m1)
Call:
lm(formula = wmc ~ bug, data = df)

Residuals:
 Min       1Q   Median       3Q      Max 
-2.17555 -0.55069  0.00892  0.46091  2.23740 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  1.93699    0.03057   63.37   <2e-16***
bug          0.84808    0.05926   14.31   <2e-16*** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.7508 on 743 degrees of freedom
Multiple R-squared:  0.2161,    Adjusted R-squared:  0.215 
F-statistic: 204.8 on 1 and 743 DF,  p-value: < 2.2e-16

此模型告诉我们,在wmc上回归bug时,bug的单位增加对应wmc的0.85增加(我不知道)你的测量的原始单位是什么)。如果你看一下bug增加一个单位的截距值和线的斜率,就会反映在图中:

enter image description here

现在在第二个模型中你做了相反的事情。您在bug上对wmc进行了回归。

m2<-lm(bug~wmc,df);summary(m2)

Call:
lm(formula = bug ~ wmc, data = df)

Residuals:
 Min       1Q   Median       3Q      Max 
-0.74635 -0.26947 -0.09287  0.14058  1.67470 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) -0.31717    0.04077  -7.779 2.44e-14***
wmc          0.25477    0.01780  14.310  < 2e-16***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.4115 on 743 degrees of freedom
Multiple R-squared:  0.2161,    Adjusted R-squared:  0.215 
F-statistic: 204.8 on 1 and 743 DF,  p-value: < 2.2e-16

因此,在这种情况下,wmc的单位增加对应bug的0.25增加。这也反映在情节中,在这种情况下再次注意截距值和线的斜率相对于wmc的单位增加。

enter image description here