h2o检查站真正做了什么?

时间:2017-12-13 02:09:43

标签: python h2o

h2o检查点实际上做了什么?是否使用说

创建模型
gbm_continued = H2OGradientBoostingEstimator(checkpoint= gbm_orig.model_id, ntrees = 50, seed = 1234)

是否意味着如果我们不对任何新数据进行训练,gbm_continued将具有与gbm_orig相同的参数和预测性能?

docs,说“这将构建一个新模型作为先前生成的模型的延续”,但我对“延续”实际意味着什么感到困惑。非常感谢您的解释。感谢

1 个答案:

答案 0 :(得分:1)

关键参数是ntreesepochs,用于深度学习模型)。我将引用我自己的书(实用机器学习与H2O,第103页):

  

指定纪元或树木数量时,请指定总金额   你想要的训练,如果你从头开始,而不是你想要多少额外的纪元或树木。

因此,在您的情况下,如果您的原始模型是使用50棵树制作的,那么您的新模型实际上只会复制现有模型。但是如果您的原始模型是使用ntrees = 20制作的,并且您的新模型将其用作检查点但使用ntrees = 50,那么它将为模型添加30多个树。

某些参数必须保持不变,但有些参数可以更改。例如。你可能会降低学习率。