cross-validation - H20交叉验证方案

对于K折，h2o产生K + 1个模型。然后，对于作为第六模型的主模型，h2o在整个数据集上训练（这很有意义），然后将5个保持预测组合为1。

如果有1,000行，并且我们要进行5折的80/20火车测试拆分，那么对于堆叠的每一折我们都会有2,00个预测。

那时我仍在跟进，h2o的一节中说： “这种方法具有一定的意义。与对交叉验证模型的5个验证指标取平均值相比，重新对保留预测进行评分可能会产生不同的指标。”

这是令我困惑的地方。当我们取5个验证指标的平均值时，是否要堆叠主要模型的预测并对其评分？

我了解是否可以计算折痕的平均MSE作为模型性能的指标。

谢谢！