我对Weka中可用的10倍交叉验证与传统的10倍交叉验证之间的区别感到有些困惑。我理解K折叠交叉验证的概念,但是从我读过的内容来看10 Weka中的折叠交叉验证有点不同。
在Weka FIRST中,模型建立在所有数据上。然后才进行10倍交叉验证。在传统的10倍交叉验证中,没有预先建立模型,建立了10个模型:每次迭代一个(如果我错了,请纠正我!)。但如果是这种情况,Weka在10倍交叉验证期间做了什么呢?它是否再次为十次迭代中的每一次创建模型,或者它是否使用先前组装的模型。谢谢!
答案 0 :(得分:3)
据我所知,Weka(和其他评估方法)中的交叉验证仅用于估计泛化误差。也就是说,(隐式)假设是您希望将学习的模型与您未提供给Weka的数据(也称为“验证集”)一起使用。因此,您获得的模型将对整个数据进行培训。
在交叉验证期间,它会训练和评估许多不同的模型(在您的情况下为10),以估计学习模型的概括程度。您实际上并未看到这些模型 - 它们仅在内部使用。显示的模型不会被评估。