在R中建立的Tukey-HSD统计检验图形中置信区间的含义

时间:2014-11-01 01:30:35

标签: r statistics statistical-test

我进行了5x2交叉验证实验,然后,我进行了Tukey-HSD成对比较,比较了5种技术的10种准确度,如下所示。

Tukey-HSD Pairwise Statistical test

上面的图形是在以下R命令之后产生的:

data <- read.table("experimento-geral.txt", head=TRUE, sep=",", dec=".");
data$metodo <- factor(data$metodo);
summary(data$acuracia)
aov.data <- aov(data$acuracia ~ data$metodo, data=data)
anova(aov.data)
tky <- TukeyHSD(aov.data, "data$metodo");
png("pertubacao-metodo.png",width=320,height=480)
plot(tky)

我想知道的是为什么这个图中的一对技术仅由一个置信区间表示。

我所知道的是,一种技术可以用一个置信区间来表示。为什么在图形中一个置信区间代表了几种技术?这是两个置信区间的减法?

1 个答案:

答案 0 :(得分:3)

我并不完全遵循你在ANOVA之前所做的事情,也不是因为这对Tukey配对比较的结果没有实际意义,而是......

考虑x轴标签。这表明该比例是acuracia级对metodo值均值的差异。因此,对于每对metodo,我们对每对中考虑的两种方法的acuracia的平均值的真实差异进行单一估计。该估计值存在不确定性。这种不确定性反映在该对的平均差异的置信区间内。这些置信区间的宽度已经根据Tukey的HSD方法进行了调整,以控制比较集(族)上的I类错误率。

要掌握的关键是每对的比较减少到每对的观察平均值的差异。这是每对方法的单一估计值,因此对该单一估计值具有单一置信度。