在R中构建分类树时,如何解释因子变量的rpart拆分?

时间:2010-04-08 02:59:16

标签: r rpart cart-analysis

如果因子变量是气候,有4个可能的值:热带,干旱,温带,雪和我rpart树中的节点被标记为“气候:ab”,分裂是什么?

1 个答案:

答案 0 :(得分:8)

我假设您使用标准方式绘制树

plot(f)
text(f)

正如您可以阅读text.rpart的帮助,默认因子变量的参数pretty以字母形式显示,因此a表示levels(Climate)[1],这意味着在左侧节点上用Climate==levels(Climate)[1]观察,在右边观察其他人。

您可以使用

直接打印关卡
plot(f)
text(f, pretty=1)

Created by rpart

但我建议您使用maptree package中的draw.tree

require(maptree)
draw.tree(f)

Created by maptree

我使用假数据做图:

X <- data.frame(
    y=rep(1:4,25),
    Climate=rep(c("Tropical", "Arid", "Temperate", "Snow"),25)
)
f <- rpart(y~Climate, X)