我创建了一个包含所有分类变量的决策树模型。这些分类变量中的一些具有超过100个可能的值。
这是我的代码:
model = rpart(score ~., data = dataset);
plot(model)
text(model)
问题是text(model)
使用相应分类变量的长列值列表为每个拆分节点添加注释。价值观相互挤压,难以看清。我正在寻找text(model)
的选项,只显示变量名称并禁止所有值。这样,至少绘制的树是清晰的,并显示在每个节点使用哪个变量。
提前致谢!
利奥
答案 0 :(得分:2)
rpart.plot中的prp
功能可能会有所帮助吗?
有许多选项可用于绘制不同的树布局,您可以使用faclen
命令缩写分割级别。
喜欢的东西;
library(rpart.plot)
model = rpart(score ~., data = dataset)
prp(model, faclen = 2)
可能有助于整理它。 (注意:将faclen设置为1表示每个因子级别将按字母顺序分配一个字母。)