我正在尝试获取 XGBoost 分类器的特征重要性,但不知道如何在使用 GridSearchCV 时在整个预处理过程中保留列名。
我尝试了什么:
model = clf_gridcv.best_estimator_
model.steps[-1][1].get_booster().feature_names
>>> ['f0',
'f1',
'f2',
'f3']
我知道如何在不使用自动化管道时获取实际功能名称,但由于我想要/需要使用 GridSearch,因此不可以选择不使用管道。
供参考的管道:
ColumnTransformer
-> StandardScaler
-> VarianceThreshold
-> SelectKBest
-> Classifier