作为R的初学者,我使用提供的" car.test.frame"创建了一个分类树。根据国家/地区预测里程的数据集。我输入的命令是:
> z.auto <- rpart(Mileage ~ Country, car.test.frame, method="class")
> plot(z.auto)
> text(z.auto)
这导致了以下树:
如您所见,在顶层,Country = cegh提供第一次分割,Country = egh提供第二次分割。如何更改这些以反映实际的国家/地区名称?我如何真正了解图表?
答案 0 :(得分:0)
有趣的问题。另一个名叫Andrie de Vries的人似乎也面临着类似的问题,因为他开发了一个专门用于使用今年出版的ggplot可视化此类情节的软件包。要解决您的问题,请下载ggdendro。要查看漂亮的图片,请参阅the vignette.
fitr <- dendro_data(z.auto)
fitr$labels$label<- c("Country= Japan,Korea,Sweden,USA", "Country= Korea,Sweden,USA")
ggplot() +
geom_segment(data=fitr$segments, aes(x=x, y=y, xend=xend, yend=yend)) +
geom_text(data=fitr$labels, aes(x=x, y=y, label=label)) +
geom_text(data=fitr$leaf_labels, aes(x=x, y=y, label=label)) +
theme_dendro()