通过@ leader @ model访问automl领导者时返回空列表

时间:2018-08-08 13:13:59

标签: r h2o automl

运行h2o.automl()返回页首横幅中的单个模型;但是,当尝试通过@leader@model访问实际模型时,会发生以下错误:

  

is.H2OFrame(x)中的错误:尝试从对象获取插槽“指标”   没有插槽的基本类(“ NULL”)的

同样,在领导者模型上调用h2o.predict()时,也会收到错误消息:

  

.h2o.doSafeREST(h2oRestApiVersion = h2oRestApiVersion,   urlSuffix = page ,:错误消息:在以下位置找不到对象'dummy'   功能:预测参数:模型

使用h2o中的v3.20.0.2 R在同一会话中运行模型。

1 个答案:

答案 0 :(得分:2)

我认为正在发生的事情是您无法在一小时内训练一个模型,因此,当您尝试收集领导者模型时,它试图获取不完整的模型,并且会出错。您没有很多行,但是您有很多列。

由于很难预测模型训练将花费多长时间,因此我将使用max_models参数而不是时间限制。由于AutoML在到达max_modelsmax_runtime_secs的第一个时将停止,因此我将max_runtime_secs设置为一个非常大的数字(例如999999999),然后设置max_models = 10或其他任何值您喜欢的号码。

第二,由于您拥有非常广泛的数据,因此建议您关闭随机森林和GBM模型,并保留GLM和深度学习模型。为此,设置exclude_algos = c("DRF", "GBM")。在12万列上训练基于树的模型将花费很长时间。

要考虑的另一个不错的选择是,首先对数据应用PCAGLRM以将维数减少到<500列,然后可以在AutoML运行中包括基于树的模型。 / p>