lm(y~x1 / x2)和aov(y~x1 + Error(x2))之间的差异

时间:2017-05-09 16:50:05

标签: r anova

我无法理解这两种符号之间的区别。

根据R intro y~x1 / x2表示嵌套在x1中的x2。如果x1是一个因子而x2是一个连续变量,那么lm(y~x1 / x2)是嵌套ANCOVA的正确表示吗?

令人困惑的是,一些在线帮助主题建议使用aov(y~x1 + Error(x2))来表示嵌套的anova。然而,这两个代码的结果完全不同。

例如:

x2 = rnorm(1000,2)
x1 = rep( c("A","B"), each=500)
y  = x2*3+rnorm(1000)

在这种情况下,我希望x2是重要的,x1是非重要的。

summary(aov(y~x1+Error(x2))) 
Error: x2
 Df Sum Sq Mean Sq
 x1  1   9262    9262

 Error: Within
       Df Sum Sq Mean Sq F value Pr(>F)
 x1          1    0.0  0.0003       0  0.985
 Residuals 997  967.9  0.9708      

aov()按预期工作。但是,lm()....

summary(lm( y~x1/x2))

Call:
lm(formula = y ~ x1/x2)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.4468 -0.6352  0.0092  0.6526  2.8294 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  0.08727    0.09566   0.912   0.3618    
x1B         -0.24501    0.13715  -1.786   0.0743 .  
x1A:x2       2.94012    0.04362  67.401   <2e-16 ***
x1B:x2       3.06272    0.04326  70.806   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.9838 on 996 degrees of freedom
Multiple R-squared:  0.9058,    Adjusted R-squared:  0.9055 
F-statistic:  3191 on 3 and 996 DF,  p-value: < 2.2e-16

x1略显重要,在许多次迭代中它是非常重要的?这些结果如何如此不同?

我错过了什么?这两个公式不是代表同一个东西?或者我是否误解了基础统计数据?

0 个答案:

没有答案