IRIS DATSET
dt3 = rpart(Species ~., control = rpart.control( minsplit = 10, maxdepth = 5),data=iris , method = "poisson")
dt3 [contents obtained from dt3][2]
,情节如图所示。
所以我的问题是,使用回归树时,特定框what is 2 ; 300 / 150 and 100% in root node
中的参数是什么?
请帮我解决。
答案 0 :(得分:1)
我不确定你为什么决定对数据使用泊松分布,如果你没有通过方法参数,它会生成这个图 -
根据rpart.plot文档(您使用并没有提及!) -
Each node shows
- the predicted class
- the predicted probability of each class,
- the percentage of observations in the node.
因此,在第一个节点中,setosa中的多数类,每个类的概率为33%,并且使用了100%的观测值。类似地,在绿色节点中,多数类是virginica,98%的数据属于virginica,并且31%的观察值存在于此节点中。
在发布此处之前请先google并参阅文档。另外,总是提供您用于数据的代码。