随机森林的可解释性

时间:2018-09-22 16:06:05

标签: python python-3.x machine-learning scikit-learn random-forest

我一直在使用sklearn [size = 15, width = 8, height = 13]解决二进制分类问题。

对于特定的样本预测,我希望能够知道如何更改特征值以使预测发生变化。

例如假设我有一个probability = 0.9条目,并且模型给我一个class 1属于size的信息。我想说的是“将1510更改为probability=0.1”,然后再更改您的client = Smartsheet::Client.new(token: ACCESS_TOKEN) sheets = client.sheets.list

然后最佳地,我想要的是要素值中从一个类别传递到另一个类别(或概率变化最大的类别)中最小的“渐变”。

也许我错了,但是从我看过的LIME和treeinterpreter包中看不到这种信息。

谢谢。

2 个答案:

答案 0 :(得分:0)

我知道两种解释随机森林的方法:

  • 如果您使用sklearn随机森林,则可以使用feature_importances_类属性(值越高越好)
  • 一种更通用的解释“黑匣子模型”的方法是sensitivity analisys,我想在您的问题中您会猜到

答案 1 :(得分:0)

偏相关图近似于目标与在所有其他自变量上边缘化的特定自变量之间的依存关系。

虽然没有在所有点上都给出精确的梯度。它有助于我们直观地了解变量行为。

您可以在这里找到更多有关它的信息: http://scikit-learn.org/stable/auto_examples/ensemble/plot_partial_dependence.html