我有5个不同大小的数据集,对于每个数据集,我选择了10个与数据库大小相同的自举样本,对于每个样本,我有真阳性,真阴性,误报,假阴性的值而样本意味着。我可以将所有样本值加起来,即使它们的大小不同吗?使用R构建所有数据库的ROC曲线的最佳方法是什么?什么是最好的统计测试?我尝试使用 pROC
和 ROCR
包,但他们需要预测值和类(这是我没有的值,我只有tp,tn,fp和fn的值。
答案 0 :(得分:0)
我知道你在使用某种预测模型吗?然后,该模型的输出以某种方式被阈值化为正/负调用,然后用于计算TP,TN,FP,FN。如果是这种情况,那么在阈值处理之前预测模型的连续输出应该用于pROC和ROCR。