H2o XGBOOST 变量重要性

时间:2020-12-26 05:49:02

标签: python xgboost h2o

我在带有 Xgboost 的数据集上使用 H2o 构建了一个 ~4MM rows and ~7k columns 模型。当我将变量重要性导出到 CSV 文件时,我只有大约 3k attributes

这是否意味着 H2o 会自动删除那些重要性为 0 的变量?

xgbm_quick = H2OXGBoostEstimator(model_id = model_id, **hyperparams_new)
xgbm_quick.train(x = x, y = y, training_frame = train_data, validation_frame = validation_data, weights_column = wgt_col)
pd.DataFrame(xgbm_quick.varimp()).to_csv(os.path.join(results_output_dir , model_id +"_varimp.csv"), index=False)

0 个答案:

没有答案