如何显示正确的国家而不是“cegh”?

时间:2014-12-31 18:18:58

标签: r rpart

作为R的初学者,我使用提供的" car.test.frame"创建了一个分类树。根据国家/地区预测里程的数据集。我输入的命令是:

> z.auto <- rpart(Mileage ~ Country, car.test.frame, method="class")
> plot(z.auto)
> text(z.auto)   

这导致了以下树: Classification Tree for Mileage

如您所见,在顶层,Country = cegh提供第一次分割,Country = egh提供第二次分割。如何更改这些以反映实际的国家/地区名称?我如何真正了解图表?

1 个答案:

答案 0 :(得分:0)

有趣的问题。另一个名叫Andrie de Vries的人似乎也面临着类似的问题,因为他开发了一个专门用于使用今年出版的ggplot可视化此类情节的软件包。要解决您的问题,请下载ggdendro。要查看漂亮的图片,请参阅the vignette.

fitr <- dendro_data(z.auto)
fitr$labels$label<- c("Country= Japan,Korea,Sweden,USA", "Country= Korea,Sweden,USA")
ggplot() +
  geom_segment(data=fitr$segments, aes(x=x, y=y, xend=xend, yend=yend)) +
  geom_text(data=fitr$labels, aes(x=x, y=y, label=label)) +
  geom_text(data=fitr$leaf_labels, aes(x=x, y=y, label=label)) +
  theme_dendro()