我正在尝试使用重复的ANOVA轮次将大型数据集分类到不同的类别。对于数据集中的每个元素,我有12个数据点,它们代表四个条件中的每一个的三个重复,这两个条件是两个变量1的两个组合。数据是与对照相比的一些相对表达式,这意味着对于控件本身,所有十二个值都是1:
>at
v1 v2 values
1. a X 1
2. b X 1
3. a X 1
4. b X 1
5. a X 1
6. b X 1
7. a Y 1
8. b Y 1
9. a Y 1
10. b Y 1
11. a Y 1
12. b Y 1
我用这种方式分析(Tukey包装器给了我关于它是否上升或下降的信息,除了它是否不同,这就是我使用它的原因):
stats <- TukeyHSD(aov(values~v1+v2, data=at))
> stats
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = values ~ v1 + v2, data = at)
$v1
diff lwr upr p adj
a-b 4.440892e-16 -1.359166e-16 1.024095e-15 0.1173068
$v2
diff lwr upr p adj
X-Y -4.440892e-16 -1.024095e-15 1.359166e-16 0.1173068
我预计p值非常接近或等于1,因为很明显,这两个测试的两组相同的零假设是正确的。相反,p值非常低,为0.117!显然,差异和边界很小(e-16)所以我猜测问题是数字的内部存储稍微偏离1,但我不知道如何解决问题。有什么建议? 非常感谢!
我正在添加一些示例数据:
aX1 bX1 aX2 bX2 aX3 bX3 aY1 bY1 aY2 bY2 aY3 bY3
element1 0.112 0 0.172 0.072 0.058 0.055 0 0 0.046 0 0.042 0
element2 0.859 0.294 0.565 0 0.669 0 0.11 0 1.707 0 1.324 0
element3 1.255 0.721 3.645 1.636 5.36 6.701 0 0.097 0.533 0.209 0.358 2.219