我对R和决策树都很新,所以如果这是一个愚蠢的问题,那就很抱歉。
我正在尝试在R中创建一个决策树。它正在工作,但是当它看起来不太好时。它看起来很沮丧。我知道当我扩展图像时它看起来更好,但在Jupyter中看起来也不太好。
这是我的代码:
library(titanic)
library(party)
data("titanic_train")
surv_tree <- ctree(formula = as.factor(Survived) ~ as.factor(Pclass) + as.factor(Sex) + Age, data = titanic_train)
plot(surv_tree)
这是我的意思:
我想使用rpart,但它并不准确。它不是将“Pclass”视为一个分类变量,而是令人烦恼和不准确。
答案 0 :(得分:0)
最简单的解决方案是将树绘制在更大的设备上(例如,8x16in):
准确地说,上面的图是使用png(file = "tree.png", height = 8, width = 16, units = "in", res = 150)
创建的。 (根据您用于动态创建图形的引擎,仅设置高度/宽度就足够了。)
此外,如果您使用plot(..., gp = gpar(fontsize = ...))
的新partykit
实施而不是旧的ctree()
实施,则可以通过party
调整字体大小。
最后,我会转换数据框中的因子而不是公式中的因子。然后树中的标签看起来也更好:
titanic_train <- transform(titanic_train,
Survived = factor(Survived),
Pclass = factor(Pclass),
Sex = factor(Sex)
)
plot(ctree(Survived ~ Pclass + Sex + Age, data = titanic_train))