我正在寻找在R中绘制回归树的方法,我在rattle
包中遇到了fancyRpartPlot()函数。我查看了上面链接的页面上的示例树,我注意到框中的颜色有渐变。节点1和2具有比其他PS盒更深的绿色调。与其他WS盒子相比,节点27具有最暗的蓝色色调。颜色的差异是什么意思?
答案 0 :(得分:1)
我在这个领域远非专业人士(所以请原谅不完美的术语),但是我自己的一个更明显的例子帮助我最近解决了这个问题。渐变表示该节点的准确性。我把这个例子包含在这里,因为我发现它更清楚了:
http://s3.postimg.org/6lx10824z/Screen_Shot_2015_03_09_at_20_18_44.png
绿色节点表示按树分类为A的个体,蓝色节点分类为B,橙色节点分类为C.梯度是节点中间三个数字的直观表示:记住默认情况下,因子的级别按字母顺序排列,这三个数字中的第一个是该节点中实际归类为第一级别的个体比例(A),在我的数据中;第二个数字是实际分类为B的比例,第三个是C的比例。
如果你看到右下方极亮的橙色节点,按模型分类为C,第三个数字表示这些人中有89%真的是Cs,而2%是As和9%Bs。最亮的绿色(A)节点(从左下方第二个)由90%的实际As组成,误差率为10%。相反,真正淡绿色的节点(左中间)有61%的错误率。
正如我所说,这只是我的解释,但它也适用于你的例子:左下角最暗的绿色节点的错误率仅为9%,而最暗的蓝色节点只有右边的第三个16 %。
希望这有帮助!