我在训练数据集上运行了一个随机森林(占父数据集的60%)。
我使用R中的“预测”函数来评估模型在测试数据集上的表现(父数据集的40%)
我用过
require(randomForest)
trained_model <- randomForest(y~.,data = training,
importance=TRUE,
keep.forest=TRUE)
result <- predict(trained_model, type = response, newdata=testing[-17])
删除了第17列,因为它是“y”
问题是“结果”是一个数组,这有一种方法可以将这个预测值作为新列添加回测试数据集
像
这样的东西Id x1 x2 ...... Xn y predicted
1 0.1 0.12 23 no no
答案 0 :(得分:1)
这样做:
testing[ ,(ncol(testing)+1)] <- result
当结果将添加回测试数据集时,将会有一个列而不是数组。