Question

我有一个XGBoost模型，使用SHAP值来解释单个预测的特征贡献。我需要对为什么将其归类为0或1的各个样本提供一些指导。

我了解到所有特征的总和应等于边际概率，但是我可以（或者我应该因为定义不明确而不应该这样做）来计算小计吗？

我合并了多个数据源，数据源以功能名称编码，例如：

data_str = "15+i10 15+ i10 15 +i10 15 + i10"
data_str = re.sub("\+(?= )", "", data_str)

我想总结来自同一来源的特征，并得出一个结论，例如来自source_A的特征趋向于整体（正和）趋向于类别1，而source_B根本没有作用（即，总和）设为零），并且source_Z趋向于类别0（负和）。

到目前为止，我所读的书暗示我可以这样做，但是我想听听对此事的第二意见？我可以使用这样的SHAP功能吗？

感谢您的帮助/想法最好，