决策树R.

时间:2015-02-20 15:04:01

标签: r decision-tree

我的目的是根据使用ctree R包的一些训练集对我的数据集进行分类。我在理解参数公式和数据应该是什么时遇到了问题。

features <- c("c1", "c2", "c3", "c4", "c5","s1","s2","s3","s4","s5","class")
t1 <- data.frame(t(apply(a[features], 1, function(c) {
x <- rep(0,14)
for(i in 1:5) {
x[c[[paste("c", i, sep="")]]] <- x[c[[paste("c", i, sep="")]]] + 1
}
x[14]= c[11]
x
})))

library (rpart)
tree.1 <- rpart(t1$class ~ class,      method="class",data=t1,control=rpart.control(minsplit=10,cp=0))
plot(tree.1)
pred <- predict(tree.1, newdata=t2)
library(caret)
table(pred=pred, true=t2$class)

表中的错误(pred = pred,true = t2 $ class):   所有参数都必须是相同的长度

我认为在使用训练集的情况下的公式将是训练集(t1~class)的输出类,并且数据将是整个训练集(t1)。如何正确编写以便我不会收到上述错误?或者我是否错过了解释参数?

0 个答案:

没有答案