XGBoost API具有两个有关功能的数据点
- 功能重要性,可通过以下方式访问
xgb_bst.get_score(importance_type ='gain')
文档将这些解释为:
获取每个功能的功能重要性。重要性类型可以定义为:
“增益”:使用该功能所有细分的平均增益。
- 功能性贡献,可由以下人员访问
feature_contribs = xgb_bst.predict(dtest,pred_contribs = True)
根据文档,输出将为大小矩阵(nsample,nfeats +1),每条记录均指示该预测的特征贡献(SHAP值)。所有特征贡献的总和等于预测的原始未变换边际值。
我的问题是
- 两者之间有什么相关性,因为从我看到的功能来看,
重要性(高收益)并不一定是头等大事
大多数个人数据的贡献者(正面),反之
是吗?
- 直觉上,我如何解释功能重要性与功能
有贡献吗?它们有何不同?