我无法理解这两种符号之间的区别。
根据R intro y~x1 / x2表示嵌套在x1中的x2。如果x1是一个因子而x2是一个连续变量,那么lm(y~x1 / x2)是嵌套ANCOVA的正确表示吗?
令人困惑的是,一些在线帮助主题建议使用aov(y~x1 + Error(x2))来表示嵌套的anova。然而,这两个代码的结果完全不同。
例如:
x2 = rnorm(1000,2)
x1 = rep( c("A","B"), each=500)
y = x2*3+rnorm(1000)
在这种情况下,我希望x2是重要的,x1是非重要的。
summary(aov(y~x1+Error(x2)))
Error: x2
Df Sum Sq Mean Sq
x1 1 9262 9262
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
x1 1 0.0 0.0003 0 0.985
Residuals 997 967.9 0.9708
aov()按预期工作。但是,lm()....
summary(lm( y~x1/x2))
Call:
lm(formula = y ~ x1/x2)
Residuals:
Min 1Q Median 3Q Max
-3.4468 -0.6352 0.0092 0.6526 2.8294
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.08727 0.09566 0.912 0.3618
x1B -0.24501 0.13715 -1.786 0.0743 .
x1A:x2 2.94012 0.04362 67.401 <2e-16 ***
x1B:x2 3.06272 0.04326 70.806 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.9838 on 996 degrees of freedom
Multiple R-squared: 0.9058, Adjusted R-squared: 0.9055
F-statistic: 3191 on 3 and 996 DF, p-value: < 2.2e-16
x1略显重要,在许多次迭代中它是非常重要的?这些结果如何如此不同?
我错过了什么?这两个公式不是代表同一个东西?或者我是否误解了基础统计数据?