ROCR错误:预测格式无效

时间:2016-11-24 10:05:09

标签: r r-caret proc-r-package

从glmnet获取我的预测后,我试图在“ROCR”包中使用“预测”函数来获取tpr,fpr等,但是得到了这个错误:

pred <- prediction(pred_glmnet_s5_3class, y)
Error in prediction(pred_glmnet_s5_3class, y) : 
Format of predictions is invalid.

我输出了glmnet预测和标签,看起来它们的格式相似,因此我不明白这里有什么无效。

代码如下,输入可以在input找到。它是一个小型数据集,不应该花费太多时间来运行。

library("ROCR")
library("caret")
sensor6data_s5_3class <- read.csv("/home/sensei/clustering /sensor6data_f21_s5_with3Labels.csv")
sensor6data_s5_3class <- within(sensor6data_s5_3class, Class <- as.factor(Class))
sensor6data_s5_3class$Class2 <- relevel(sensor6data_s5_3class$Class,ref="1")

set.seed("4321")
inTrain_s5_3class <- createDataPartition(y = sensor6data_s5_3class$Class, p = .75, list = FALSE)
training_s5_3class <- sensor6data_s5_3class[inTrain_s5_3class,]
testing_s5_3class <- sensor6data_s5_3class[-inTrain_s5_3class,] 
y <- testing_s5_3class[,22]

ctrl_s5_3class <- trainControl(method = "repeatedcv", number = 10, repeats = 10 , savePredictions = TRUE)
model_train_glmnet_s5_3class <- train(Class2 ~ ZCR + Energy + SpectralC + SpectralS + SpectralE + SpectralF + SpectralR + MFCC1 + MFCC2 + MFCC3 + MFCC4 + MFCC5 + MFCC6 + MFCC7 + MFCC8 + MFCC9 + MFCC10 + MFCC11 + MFCC12 + MFCC13, data = training_s5_3class, method="glmnet", trControl = ctrl_s5_3class)
pred_glmnet_s5_3class = predict(model_train_glmnet_s5_3class, newdata=testing_s5_3class, s = "model_train_glmnet_s5_3class$finalModel$lambdaOpt")

pred <- prediction(pred_glmnet_s5_3class, y)

感谢您的帮助!

1 个答案:

答案 0 :(得分:7)

主要问题是prediction采用&#34;向量,矩阵,列表或数据框&#34;适用于predictionslabels个参数。即使pred_glmnet_s5_3classy看起来像矢量,但它们不是,例如。

sapply(c(is.vector, is.matrix, is.list, is.data.frame), do.call, list(y))
# [1] FALSE FALSE FALSE FALSE

事实上,它们是因素(可以从例如class(y)看到),而?is.vector通知我们

  

请注意,因素是不是向量; 'is.vector'返回'FALSE'        并且'as.vector'将因子转换为'模式的字符向量        =&#34;任何&#34;'。

我们可以将两个对象都转换为numeric

pred <- prediction(as.numeric(pred_glmnet_s5_3class), as.numeric(y))
#   Number of classes is not equal to 2.
# ROCR currently supports only evaluation of binary classification tasks.

不幸的是,它产生了一个不同的问题,超出了这个问题的范围。