应用错误收集

通过@ leader @ model访问automl领导者时返回空列表

时间：2018-08-08 13:13:59

标签： r h2o automl

运行h2o.automl()返回页首横幅中的单个模型；但是，当尝试通过@leader@model访问实际模型时，会发生以下错误：

is.H2OFrame（x）中的错误：尝试从对象获取插槽“指标” 没有插槽的基本类（“ NULL”）的

同样，在领导者模型上调用h2o.predict()时，也会收到错误消息：

.h2o.doSafeREST（h2oRestApiVersion = h2oRestApiVersion， urlSuffix = page ，：错误消息：在以下位置找不到对象'dummy' 功能：预测参数：模型

使用h2o中的v3.20.0.2 R在同一会话中运行模型。

1 个答案:

答案 0 :(得分：2)

我认为正在发生的事情是您无法在一小时内训练一个模型，因此，当您尝试收集领导者模型时，它试图获取不完整的模型，并且会出错。您没有很多行，但是您有很多列。

由于很难预测模型训练将花费多长时间，因此我将使用max_models参数而不是时间限制。由于AutoML在到达max_models或max_runtime_secs的第一个时将停止，因此我将max_runtime_secs设置为一个非常大的数字（例如999999999），然后设置max_models = 10或其他任何值您喜欢的号码。

第二，由于您拥有非常广泛的数据，因此建议您关闭随机森林和GBM模型，并保留GLM和深度学习模型。为此，设置exclude_algos = c("DRF", "GBM")。在12万列上训练基于树的模型将花费很长时间。

要考虑的另一个不错的选择是，首先对数据应用PCA或GLRM以将维数减少到<500列，然后可以在AutoML运行中包括基于树的模型。 / p>