使用rpart(虹膜数据集)预测回归树

时间:2018-06-08 10:34:00

标签: r rstudio regression

IRIS DATSET

dt3 = rpart(Species ~., control = rpart.control( minsplit = 10, maxdepth = 5),data=iris , method = "poisson")  

dt3 [contents obtained from dt3][2]   

,情节如图所示。

IRIS DATASET回归树图

所以我的问题是,使用回归树时,特定框what is 2 ; 300 / 150 and 100% in root node中的参数是什么? 请帮我解决。

1 个答案:

答案 0 :(得分:1)

我不确定你为什么决定对数据使用泊松分布,如果你没有通过方法参数,它会生成这个图 -

enter image description here

根据rpart.plot文档(您使用并没有提及!) -

Each node shows
- the predicted class
- the predicted probability of each class,
- the percentage of observations in the node.

因此,在第一个节点中,setosa中的多数类,每个类的概率为33%,并且使用了100%的观测值。类似地,在绿色节点中,多数类是virginica,98%的数据属于virginica,并且31%的观察值存在于此节点中。

在发布此处之前请先google并参阅文档。另外,总是提供您用于数据的代码。