Question

我进行了5x2交叉验证实验，然后，我进行了Tukey-HSD成对比较，比较了5种技术的10种准确度，如下所示。

Tukey-HSD Pairwise Statistical test

上面的图形是在以下R命令之后产生的：

data <- read.table("experimento-geral.txt", head=TRUE, sep=",", dec=".");
data$metodo <- factor(data$metodo);
summary(data$acuracia)
aov.data <- aov(data$acuracia ~ data$metodo, data=data)
anova(aov.data)
tky <- TukeyHSD(aov.data, "data$metodo");
png("pertubacao-metodo.png",width=320,height=480)
plot(tky)

我想知道的是为什么这个图中的一对技术仅由一个置信区间表示。

我所知道的是，一种技术可以用一个置信区间来表示。为什么在图形中一个置信区间代表了几种技术？这是两个置信区间的减法？

Answer 1

我并不完全遵循你在ANOVA之前所做的事情，也不是因为这对Tukey配对比较的结果没有实际意义，而是......

考虑x轴标签。这表明该比例是acuracia级对metodo值均值的差异。因此，对于每对metodo，我们对每对中考虑的两种方法的acuracia的平均值的真实差异进行单一估计。该估计值存在不确定性。这种不确定性反映在该对的平均差异的置信区间内。这些置信区间的宽度已经根据Tukey的HSD方法进行了调整，以控制比较集（族）上的I类错误率。

要掌握的关键是每对的比较减少到每对的观察平均值的差异。这是每对方法的单一估计值，因此对该单一估计值具有单一置信度。

在R中建立的Tukey-HSD统计检验图形中置信区间的含义

1 个答案: