当我使用R(v 3.4.0)的预测函数作为分类树时,它给出了一个10列的输出。
p2 <- predict(mmodel,test_data,type = "matrix")
输出看起来像这样:
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
1 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
5 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
9 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
13 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
17 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
21 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
25 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
29 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
我想知道这些列的描述(每列代表的内容)。我在数据集中有4个类。
我不确定我是否理解RPART文档中的内容。
如果
type = "matrix"
:完整响应的矩阵(如果存在,则为帧$ yval2,否则为 框架$利用yval)。对于回归树,这是平均响应 泊松树是响应率和事件的数量 拟合树中的节点,对于分类树,它是 至少预测班级的连接,班级计数 拟合树中的节点和类概率(一些 版本的rpart可能包含更多列。)
答案 0 :(得分:1)
第1栏:等级编号
Cols 2-5:4级频率
Cols 6-9:4级概率
第10栏:该级别的病例数超过病例总数(也许是37到98的商数)