h2o SHAP值/ predict_contributions为伯努利分布提供了极高的值

时间:2019-07-04 18:43:39

标签: r h2o bernoulli-probability

当我使用函数h2o.predict_contributions获得bernoulli分布的SHAP值时,我得到了极高的值(即,对于某些观察/特征,SHAP的值超过1000万/低于1000万)。因此,当我将所有SHAP值求和并应用链接函数(1 /(1 + exp(-SHAP的总和)))时,得到的预测值为0或1,而不是概率为0/1

使用伯努利分布时,什么会导致如此大的SHAP值?

通过查看h2o的github帖子,似乎已经对Bernoulli发行版的SHAP:https://github.com/h2oai/h2o-3/pull/3378/files进行了测试。

此外,我还查看了受较大SHAP值影响的特征的部分依赖图,这些特征看起来很正常(即没有泄漏或极端图案)。

0 个答案:

没有答案