为什么Weka的实验者不会显示所有10倍的结果?

时间:2012-10-05 02:22:55

标签: machine-learning weka

我正在使用Weka在一组数据上运行决策树分类器。我正在使用10倍交叉验证,我想知道十个折叠中每一个的个体准确度。在Explorer上的Classify下,我可以获得有关测试数据的每个预测的大量列表。这意味着我必须手动添加所有的+。

如果有大量数据,这将需要很长时间。同样也容易犯错误。

在Experimenter下,我可以在相同的数据上设置一个10倍的交叉验证分类器(重复1次)。我可以将'row'设置为'folds',然后当我转到'column'并将其设置为'number_incorrect'时,它只显示我10个折叠中的6个。

那么如何获得所有10倍的正确数字?为什么这样做呢?

2 个答案:

答案 0 :(得分:1)

在Analyze选项卡中,您应选择:

1)行:

2)专栏:您必须选择运行折叠您想要的结果

如果省略第二部分中的一个选项,您将只看到部分信息。

答案 1 :(得分:0)

根据我的理解,Weka这样做的方式是,在K折交叉验证(CV)中,单个折叠的个体准确性没有那么有意义。 K-fold CV的整个想法是简单地将数据分成K个子集,并依次省略每个折叠以进行验证。然后验证误差计算为K-fold的平均值,这是我们学习算法误差的无偏估计

有关详细信息,请参阅以下链接: https://alliance.seas.upenn.edu/~cis520/wiki/index.php?n=Lectures.Overfitting