我正在尝试使用2个变量WMC和BUG进行回归线
当BUG是X轴时,回归线看起来很完美。 然而,当BUG是Y轴而WMC是X轴时,该线表现得很奇怪,它似乎根本不适合该情节。我做错了什么?
reg1 <- lm (WMC ~ BUG)
plot(BUG,WMC)
abline(reg1)
plot1 http://i57.tinypic.com/2lu305y.png
reg1 <- lm (BUG ~ WMC)
plot(WMC,BUG)
abline(reg1)
plot2 http://i57.tinypic.com/efexdf.png
是的,我是统计数据菜鸟。
答案 0 :(得分:1)
暂时忽略模型的基本原理:如何绘制线条没有任何问题。线条看起来与图形不同的原因是因为您估计了两种不同的模型。
因此,让我们从您的第一个模型开始,在wmc
上对bug
进行回归
m1<-lm(wmc~bug,df);summary(m1)
Call:
lm(formula = wmc ~ bug, data = df)
Residuals:
Min 1Q Median 3Q Max
-2.17555 -0.55069 0.00892 0.46091 2.23740
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.93699 0.03057 63.37 <2e-16***
bug 0.84808 0.05926 14.31 <2e-16***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7508 on 743 degrees of freedom
Multiple R-squared: 0.2161, Adjusted R-squared: 0.215
F-statistic: 204.8 on 1 and 743 DF, p-value: < 2.2e-16
此模型告诉我们,在wmc
上回归bug
时,bug
的单位增加对应wmc
的0.85增加(我不知道)你的测量的原始单位是什么)。如果你看一下bug
增加一个单位的截距值和线的斜率,就会反映在图中:
现在在第二个模型中你做了相反的事情。您在bug
上对wmc
进行了回归。
m2<-lm(bug~wmc,df);summary(m2)
Call:
lm(formula = bug ~ wmc, data = df)
Residuals:
Min 1Q Median 3Q Max
-0.74635 -0.26947 -0.09287 0.14058 1.67470
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.31717 0.04077 -7.779 2.44e-14***
wmc 0.25477 0.01780 14.310 < 2e-16***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.4115 on 743 degrees of freedom
Multiple R-squared: 0.2161, Adjusted R-squared: 0.215
F-statistic: 204.8 on 1 and 743 DF, p-value: < 2.2e-16
因此,在这种情况下,wmc
的单位增加对应bug
的0.25增加。这也反映在情节中,在这种情况下再次注意截距值和线的斜率相对于wmc
的单位增加。