text rpart决策树模型 - 如何在每个拆分节点处抑制长列表值

时间:2013-08-06 23:03:31

标签: r plot tree r-factor rpart

我创建了一个包含所有分类变量的决策树模型。这些分类变量中的一些具有超过100个可能的值。

这是我的代码:

model = rpart(score ~., data = dataset);
plot(model)
text(model)

问题是text(model)使用相应分类变量的长列值列表为每个拆分节点添加注释。价值观相互挤压,难以看清。我正在寻找text(model)的选项,只显示变量名称并禁止所有值。这样,至少绘制的树是清晰的,并显示在每个节点使用哪个变量。

提前致谢!

利奥

1 个答案:

答案 0 :(得分:2)

rpart.plot中的prp功能可能会有所帮助吗?

有许多选项可用于绘制不同的树布局,您可以使用faclen命令缩写分割级别。

喜欢的东西;

library(rpart.plot)
model = rpart(score ~., data = dataset)

prp(model, faclen = 2)

可能有助于整理它。 (注意:将faclen设置为1表示每个因子级别将按字母顺序分配一个字母。)