我使用随机森林技术构建了一个特征重要性表,并发现了一些重要特征。其中一项功能排名第二,并且始终是一项非常重要的功能。
然后我在其上计算了部分依赖图,并观察到这一点:
from sklearn.ensemble.partial_dependence import plot_partial_dependence
from sklearn.ensemble.partial_dependence import partial_dependence
我试图理解为什么尽管这个特殊变量位于我的功能重要性列表的首位却没有观察到趋势?
对于其他一些变量,我实际上已经找到了变量相对于目标的变化方向(二进制结果)。