Python的随机森林特征重要性稳健性

时间:2020-02-11 01:42:17

标签: python random-forest

我正在使用Sklearn的Random Forest以获得功能重要性。但是,功能的重要性可能会通过更改RF中的random_state参数而改变。我想知道是否有任何方法可以使RF具有强大的功能重要性?

1 个答案:

答案 0 :(得分:0)

这是由于Random Forest算法的原理所致。 RF通过启发式贪婪方式找到最优解。 并以这种启发式方式工作,它可以减轻具有随机采样特征和样本的多棵树的影响。 在这里random_state给出了用于采样的随机数。 如果您看到以下文件,则显示

如果为int,则random_state是随机数生成器使用的种子;否则为false。如果是RandomState实例,则random_state是随机数生成器;如果为None,则随机数生成器是np.random使用的RandomState实例。

[https://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html][1]

因此,如果将random_state设置为固定值,则对于功能重要性而言可能具有固定值。 它不能保证鲁棒性,因为RF并不是算法可以保证鲁棒性,而是根据其启发式发现给出答案。