运行h2o.automl()
返回页首横幅中的单个模型;但是,当尝试通过@leader@model
访问实际模型时,会发生以下错误:
is.H2OFrame(x)中的错误:尝试从对象获取插槽“指标” 没有插槽的基本类(“ NULL”)的
同样,在领导者模型上调用h2o.predict()
时,也会收到错误消息:
.h2o.doSafeREST(h2oRestApiVersion = h2oRestApiVersion, urlSuffix = page ,:错误消息:在以下位置找不到对象'dummy' 功能:预测参数:模型
使用h2o
中的v3.20.0.2
R
在同一会话中运行模型。
答案 0 :(得分:2)
我认为正在发生的事情是您无法在一小时内训练一个模型,因此,当您尝试收集领导者模型时,它试图获取不完整的模型,并且会出错。您没有很多行,但是您有很多列。
由于很难预测模型训练将花费多长时间,因此我将使用max_models
参数而不是时间限制。由于AutoML在到达max_models
或max_runtime_secs
的第一个时将停止,因此我将max_runtime_secs
设置为一个非常大的数字(例如999999999),然后设置max_models = 10
或其他任何值您喜欢的号码。
第二,由于您拥有非常广泛的数据,因此建议您关闭随机森林和GBM模型,并保留GLM和深度学习模型。为此,设置exclude_algos = c("DRF", "GBM")
。在12万列上训练基于树的模型将花费很长时间。
要考虑的另一个不错的选择是,首先对数据应用PCA或GLRM以将维数减少到<500列,然后可以在AutoML运行中包括基于树的模型。 / p>