多变量和单变量的Tukey HSD返回不同的结果

时间:2016-04-18 11:57:27

标签: r statistics anova multivariate-testing manova

我曾尝试为多变量数据集运行Tukey HSD。但是,当我对单个变量运行相同的测试时,结果完全相反。

在运行多个变量时,我在ANOVA输出中观察到以下错误:

  87个效果中有8个不可估量   估计的影响可能是不平衡的

在运行单个变量时,我在ANOVA输出中观察到以下错误:

  

估计的影响可能不平衡

这与我收到的完全相反的Tukey HSD输出有什么关系吗?另外,我该如何解决这个问题?

我使用了aov()并且在我的数据集中有近500000个数据点。

更具体地说,下面的代码给了我一个不同的结果:

代码1:

lm_test1 <- lm(y ~ x1+ x2, data=data)
glht(lm_test1, linfct = mcp(x1 = "Tukey"))

码2:

lm_test1 <- lm(y ~ x1, data=data)
glht(lm_test1, linfct = mcp(x1 = "Tukey"))

请告诉我这是怎么可能的......

1 个答案:

答案 0 :(得分:0)

经过一些研究,我找到了答案,所以我想发布这个。 R中的Anova是默认类型 - I anova。这意味着我们输入的第一个变量,在不控制任何其他因素的情况下考虑效果,另一方面,对于其他变量,在控制其他变量的影响后显示结果。因此,由于我输入我的变量作为第二个变量,所以显示的结果是在控制第一个变量之后,这是偶然的方向,与看直接效果完全相反。