限制预测数-R

时间:2018-12-28 20:40:26

标签: r

我正在尝试创建一个模型,该模型根据各种可用的团队统计数据来预测给定的团队是否进入NHL季后赛。但是,我遇到了问题。

我正在使用R,特别是插入符号包,到目前为止,我取得了相当不错的成绩,但有一个问题:我不能限制预计将进入季后赛的球队数量。

我正在使用分类变量作为预测-Y或N。

例如,使用插入符号包中的随机森林方法

rf_fit <- train(playoff ~ ., data = train_set, method = "rf")
rf_predict <- predict(rf_fit,newdata = test_data_playoffs)

mean(rf_predict == test_data_playoffs$playoff)

为我的测试集提供大约90%的准确度,但这是因为它预测过度。在NHL中,有16支球队进入了季后赛,但这预计有19支球队进入季后赛。因此,我想将“ Y”个预测的数量限制为16个。

是否有一种方法可以限制分类变量的可能响应数?我敢肯定有,但是到目前为止,谷歌搜索给我的成功有限。

编辑:提供可以使用以下代码创建的示例数据:

set.seed(100) # For reproducibility 
data <- data.frame(Y = sample(1:10,32,replace = T)/10, N = rep(NA,32))
data$N <- 1-data$Y

这将创建一个数据框,类似于使用“ prob”选项获得的数据框,其中具有Y和N的概率列表

pred <- predict(fit,newdata = test_data_playoffs, "prob") 

0 个答案:

没有答案