我正在这里阅读有关交叉验证的h2o文档 http://docs.h2o.ai/h2o/latest-stable/h2o-docs/cross-validation.html
对于K折,h2o产生K + 1个模型。然后,对于作为第六模型的主模型,h2o在整个数据集上训练(这很有意义),然后将5个保持预测组合为1。
如果有1,000行,并且我们要进行5折的80/20火车测试拆分,那么对于堆叠的每一折我们都会有2,00个预测。
那时我仍在跟进,h2o的一节中说: “这种方法具有一定的意义。与对交叉验证模型的5个验证指标取平均值相比,重新对保留预测进行评分可能会产生不同的指标。”
这是令我困惑的地方。当我们取5个验证指标的平均值时,是否要堆叠主要模型的预测并对其评分?
我了解是否可以计算折痕的平均MSE作为模型性能的指标。
谢谢!
ZH