应用错误收集

Weka中的10倍交叉验证

时间：2013-08-14 17:30:39

标签： weka cross-validation

我对Weka中可用的10倍交叉验证与传统的10倍交叉验证之间的区别感到有些困惑。我理解K折叠交叉验证的概念，但是从我读过的内容来看10 Weka中的折叠交叉验证有点不同。

在Weka FIRST中，模型建立在所有数据上。然后才进行10倍交叉验证。在传统的10倍交叉验证中，没有预先建立模型，建立了10个模型：每次迭代一个（如果我错了，请纠正我！）。但如果是这种情况，Weka在10倍交叉验证期间做了什么呢？它是否再次为十次迭代中的每一次创建模型，或者它是否使用先前组装的模型。谢谢！

1 个答案:

答案 0 :(得分：3)

据我所知，Weka（和其他评估方法）中的交叉验证仅用于估计泛化误差。也就是说，（隐式）假设是您希望将学习的模型与您未提供给Weka的数据（也称为“验证集”）一起使用。因此，您获得的模型将对整个数据进行培训。

在交叉验证期间，它会训练和评估许多不同的模型（在您的情况下为10），以估计学习模型的概括程度。您实际上并未看到这些模型 - 它们仅在内部使用。显示的模型不会被评估。