回归树或分类树?多个分类输入和数字输出

时间:2015-08-28 10:51:49

标签: r tree classification

它在统计文档中说:分类树给出了名义上的回答,例如' true'或者' false'。回归树给出数字响应。我正在尝试构建一个决策树。我正在使用数字(输出)和非数字数据(输入)。我认为分类树比回归树更合适,或者(因为回归树似乎只适用于数字数据)。是否可以使用非数字数据来预测数字数据?如果是这样,我怎么能在R中做到这一点?分类树是否合适?

谢谢:)

1 个答案:

答案 0 :(得分:1)

术语"数字响应"有点笼统。数值可以是从0到无穷大的值的变量(例如,用户数量,金额,距离),但数字也可以是取值1或0(表示是/否,男/女)或甚至是值的变量值1,2,3(代表选择1,选择2,选择3)。最好将第一种情况描述为比例/连续变量,第二种情况作为二进制变量,第三种情况作为分类变量。

第一种情况可以通过回归树(基于连续变量的数字响应)来处理,其他两种可以通过分类树来处理(分类变量响应;它们可能返回每个分类值的分类值或概率。它&# 39;由你决定。)

首先检查这些内容:http://www.statmethods.net/advstats/cart.htmlhttp://www.rdatamining.com/docs/regression-and-classification-with-r