我正在使用python中的H2o包运行xgboost。我设置为使用机器的所有32个内核。分类器位于for循环中,可为不同的参数运行分类。我正在启动h2o并在循环中将其关闭。它在循环中运行2-3回合,并返回一些运行错误“无法执行加速器操作:节点/127.0.0.1:54321上的updater处于非活动状态”。 有人知道我为什么会收到这样的错误吗?
谢谢, 埃纳兹(Elnaz)
`for dates in start_end_dates:
for window_size in window_sizes:
print dates[0], dates[1], dates[2], window_size
model_string = str(dates[0])+ '_'+ str(dates[1]) + ':'+ str(dates[2])+ ':'+ str(window_size)
## load daily transaction types
## this function runs in parallel on all cpus
daily_transactions_type_df = transform_transactions_types.transform(dates[0], dates[1], window_size)
##load daily transactions
## this function runs in parallel on all cpus
daily_transactions_df = transfrom_daily_transactions.transform(dates[0], dates[1], window_size, max_number_of_instrument)
snapshot_date = dates[1]
## user status list
user_status_list = Classification_helpers.load_user_status_data_from_gbq(snapshot_date)
user_status_list
## Normalize the data
numeric_columns = daily_transactions_type_df.iloc[:,1:].columns.tolist()
other_columns = []
daily_transactions_type_df_norm = Classification_helpers.normalize_data_without_outliers(daily_transactions_type_df, numeric_columns, other_columns)
## Normalize the data
numeric_columns = daily_transactions_df.iloc[:,1:-6].columns.tolist()
other_columns = daily_transactions_df.iloc[:,-5:].columns.tolist()
daily_transactions_df_norm = Classification_helpers.normalize_data_without_outliers(daily_transactions_df,numeric_columns,other_columns)
data_frames = [daily_transactions_type_df_norm, daily_transactions_df_norm, user_status_list[['USER_ID', 'label']]]
df = Classification_helpers.create_labelled_data(data_frames)
numeric_columns = df.iloc[:,1:-6].columns.tolist()
other_columns = df.iloc[:,-6:-1].columns.tolist()
nthreads = -1
Classification_helpers.init_h2o(nthreads)
model, performance, predictions = Classification_helpers.train_XGboost(df, numeric_columns, other_columns, model_string)
print performance.auc()`
答案 0 :(得分:0)
使用Flow接口http://127.0.0.1:54321观看操作,并注意内存使用情况。
请参阅 http://docs.h2o.ai/h2o/latest-stable/h2o-docs/flow.html#viewing-cluster-status表示您应该观看的屏幕。您将看到每个节点上的可用内存量实时更新。
如果没有更多信息,可能会猜测您的内存不足,因为您在for循环的每次迭代中使用的内存更多。
如果是这样,很难在不了解for循环内所做操作的情况下给出建议;但是,如果训练数据相同,请确保将其加载到for循环之外。在最坏的情况下,您应该在for循环中进行H2O初始化和关闭(并在每次迭代结束时保存模型,以备后用)。
哦,还有一种可能,正如您没有提到的那样:在h2o.init()调用中明确指定要提供H2O的内存量。您可能会发现,除了提供默认值以外,您还可以提供更多功能。 (但不要将H2O all 留给机器的内存,否则一切都会变得不稳定!)
答案 1 :(得分:0)
我有同样的问题。但是,当您指定(示例)max_runtime_secs = 6000
时,将不会出错。该指标解决了我的问题。
顺便说一句,尝试在h2o.xgboost
中更改参数,问题可能出在这里。