xgboost分类变量的特征重要性

时间:2018-11-15 20:21:38

标签: python xgboost categorical-data

我正在使用XGBClassifier在python中进行训练,并且我的训练数据集中有一些类别变量。最初,我计划在输入数据之前将它们转换成几个虚拟变量,但是随后将为每个虚拟对象(而不是原始分类对象)计算功能重要性。由于我还需要按重要性对所有原始变量(包括数字+类别)进行排序,因此我想知道如何获得原始变量的重要性?它只是加起来吗?

1 个答案:

答案 0 :(得分:0)

您可能可以将各个类别的重要性汇总到其原始父类别中。但是,除非这些功能具有很高的基数,否则我要花2美分单独报告它们。我倾向于在报告模型性能/重要性度量方面更加明确。