我有一个包含5个独立变量和分类因变量的数据集。
我想在R中开发一个代码,允许我预测测试数据集的最终结果。
我想使用决策树作为分类器来实现装袋。为了获得最终预测,我想使用统一的投票程序。
我开发的代码如下
set.seed(10)
all_data<-qwe
positions <- sample(nrow(all_data),size=floor((nrow(all_data)/5)*4))
training<- all_data[positions,]
testing<- all_data[-positions,]
n <-10
for (i in 1:n ){
training_positions <- sample(nrow(training), size=floor((nrow(training)/3)))
train_pos<-1:nrow(training) %in% training_positions
model_tree <- rpart(UNS~., data=training[train_pos,])
pred <- predict(model_tree, newdata = testing, type="class")
print(as.matrix(pred))
plot(pred)
text(pred)
}
我有每个决策树(10个决策树)做出的预测,但我不知道如何确定每个观察的最常见预测(我的意思是模式)。
欢迎任何帮助!
提前致谢!
致以最诚挚的问候,
Liza Vieira