这是一个与R中随机森林的输出相对应的问题。
我了解gini
,impurity
和mean accuracy plots
代表什么。我有大量不同的响应变量,并且一直在计算 MANY 不同的随机森林(每个课程分别)。
在两个输出图(平均准确度和节点纯度)之间得出的顶部预测值通常非常相似。令我感到困惑的是,我有一个输出带有一个具有高节点纯度的单个变量(后面是一个巨大的中断),但是平均精度图上的这个相同变量非常低。几乎在底部。
如果我正在解释我所阅读的内容以及在此论坛上已经给出的其他答案,
非常感谢任何见解!