如何根据python中xgboost的变量重要性绘制前k个变量?

时间:2018-04-27 06:50:56

标签: python variables xgboost important

在python中,如何通过variableI important来绘制前k个变量?

当我使用xgb.plot_importance时,它总是绘制模型中训练的所有变量。

然而,我有超过3000个功能,我不想全部绘制它们;我只关心影响力很强的前100个变量。

我知道我可以从xgb_model.get_score()中提取变量重要性,它会返回一个存储对的字典(特征,重要性)。也许这是我可以从字典中提取前k个重要变量的方向。

但我不知道如果根据前k字典手动绘制,如果用xgb.plot_importance这样的样式创建图片(直方图)。

或者有什么方法可以绘制前k个变量取决于xgboost内置API吗?

1 个答案:

答案 0 :(得分:0)

只需使用LatLngBounds中的'max_num_features'参数。

来自the documentation

  

max_num_features(int,默认无) - 顶级要素的最大数量   在情节上显示。如果为None,则将显示所有功能。

所以像这样使用它:

xgb.plot_importance()