我在带有 Xgboost
的数据集上使用 H2o
构建了一个 ~4MM rows and ~7k columns
模型。当我将变量重要性导出到 CSV 文件时,我只有大约 3k attributes
。
这是否意味着 H2o 会自动删除那些重要性为 0 的变量?
xgbm_quick = H2OXGBoostEstimator(model_id = model_id, **hyperparams_new)
xgbm_quick.train(x = x, y = y, training_frame = train_data, validation_frame = validation_data, weights_column = wgt_col)
pd.DataFrame(xgbm_quick.varimp()).to_csv(os.path.join(results_output_dir , model_id +"_varimp.csv"), index=False)