H20交叉验证方案

时间:2019-08-01 19:20:17

标签: cross-validation h2o

我正在这里阅读有关交叉验证的h2o文档 http://docs.h2o.ai/h2o/latest-stable/h2o-docs/cross-validation.html

对于K折,h2o产生K + 1个模型。然后,对于作为第六模型的主模型,h2o在整个数据集上训练(这很有意义),然后将5个保持预测组合为1。

如果有1,000行,并且我们要进行5折的80/20火车测试拆分,那么对于堆叠的每一折我们都会有2,00个预测。

那时我仍在跟进,h2o的一节中说: “这种方法具有一定的意义。与对交叉验证模型的5个验证指标取平均值相比,重新对保留预测进行评分可能会产生不同的指标。”

这是令我困惑的地方。当我们取5个验证指标的平均值时,是否要堆叠主要模型的预测并对其评分?

我了解是否可以计算折痕的平均MSE作为模型性能的指标。

谢谢!

ZH

0 个答案:

没有答案