尽管分层验证和交叉验证都是将一个大集团分成几个较小的集团,但它们的目标和原因却不同(甚至彼此反对)。因此,交叉验证不是分层类型。
通过分层,我们希望创建专门的子组,每个子组都包含相对相似的元素,可以使用更适合自定义的方法进行处理。
交叉验证是用于在有限数据样本上评估机器学习模型的重新采样程序。
因此,分层的目标是创建组,使每个组的内部方差尽可能小(以使每个组都具有特殊性),并通过交叉验证来获得具有相似分布的组(通常会随机选择每组中的元素)。
例如,在有两种类型的数据要划分为两组的情况下,分层的最佳划分为:
交叉验证的最佳划分为: