我一直在使用predict
中的R
函数来预测测试集的randomForests
模型结果,因为突然它只返回预测的水平而不是概率。我将类型指定为响应,但仍返回因子。可能导致这种情况的原因是什么?
数据包含23个变量,其中20个是因子(无序),其中两个是数字。我试图预测产品是否会出售(0或1)。以下是预测的代码:
library(randomForest)
rf = randomForest(sold ~., data = train, ntree=200, nodesize=25)
prf <- predict(rf, newdata = test, type ="response")
答案 0 :(得分:1)
set type =“prob”
data(iris)
library(randomForest)
seed(1234)
train.key = sort(sample(1:dim(iris)[1],100))
iris.train = iris[train.key,]
iris.test = iris[-train.key,]
rf = randomForest(Species ~., data = iris.train)
predicted.prob = predict(rf,newData=iris.test,type ="prob")