H2o flow automl临时样本框架

时间:2019-11-05 13:43:36

标签: frame h2o flow temporary automl

我有一个很大的框架,并使用h2o flow run automl和深度学习算法。但是,训练指标是在“临时样本框架”上计算的。我找不到任何信息。我不确定automl是否已在全帧或临时帧上运行。有人可以帮助您理解或提供指导吗?顺便说一句,我觉得这个功能不方便。 screenshot

1 个答案:

答案 0 :(得分:1)

这是深度学习模型的特殊情况,而不是AutoML流程生成的任何其他模型的情况。出于效率原因(并且由于H2O是为非常大的数据集设计的),深度学习模型中的训练指标是在原始训练框架的子集上计算的。

H2O Deep Learning algorithm中有一个名为score_training_samples的参数,默认为10,000行(由于出于效率考虑,我们进行近似采样,因此有意义的是实际子集大小为9,993)。

这应该是训练误差的一个很好的近似值。在Flow中更改此设置的唯一方法是手动(在AutoML流程之外)训练深度学习模型。