如何让决策树在R和/或Jupyter看起来不错?

时间:2018-01-02 07:37:55

标签: r jupyter-notebook jupyter decision-tree jupyter-irkernel

我对R和决策树都很新,所以如果这是一个愚蠢的问题,那就很抱歉。

我正在尝试在R中创建一个决策树。它正在工作,但是当它看起来不太好时。它看起来很沮丧。我知道当我扩展图像时它看起来更好,但在Jupyter中看起来也不太好。

这是我的代码:

library(titanic)
library(party)
data("titanic_train")
surv_tree <- ctree(formula = as.factor(Survived) ~ as.factor(Pclass) + as.factor(Sex) + Age, data = titanic_train)
plot(surv_tree)

这是我的意思:

https://imgur.com/a/UdPnE

我想使用rpart,但它并不准确。它不是将“Pclass”视为一个分类变量,而是令人烦恼和不准确。

1 个答案:

答案 0 :(得分:0)

最简单的解决方案是将树绘制在更大的设备上(例如,8x16in): tree

准确地说,上面的图是使用png(file = "tree.png", height = 8, width = 16, units = "in", res = 150)创建的。 (根据您用于动态创建图形的引擎,仅设置高度/宽度就足够了。)

此外,如果您使用plot(..., gp = gpar(fontsize = ...))的新partykit实施而不是旧的ctree()实施,则可以通过party调整字体大小。

最后,我会转换数据框中的因子而不是公式中的因子。然后树中的标签看起来也更好:

titanic_train <- transform(titanic_train,
  Survived = factor(Survived),
  Pclass = factor(Pclass),
  Sex = factor(Sex)
)
plot(ctree(Survived ~ Pclass + Sex + Age, data = titanic_train))