鉴于此类数据: SN =灵敏度; SP =特异性
Cutpoint SN 1-SP
1 0.5 0.1
2 0.7 0.2
3 0.9 0.6
如何绘制ROC曲线并计算AUC。并比较两种不同ROC曲线之间的AUC。在诸如pROC或ROCR的大多数包中,数据的输入与上面所示的不同。任何人都可以建议在R或其他方面解决这个问题的方法吗?
ROCsdat <- data.frame(cutpoint = c(5, 7, 9), TPR = c(0.56, 0.78, 0.91), FPR = c(0.01, 0.19, 0.58))
## plot version 1
op <- par(xaxs = "i", yaxs = "i")
plot(TPR ~ FPR, data = dat, xlim = c(0,1), ylim = c(0,1), type = "n")
with(dat, lines(c(0, FPR, 1), c(0, TPR, 1), type = "o", pch = 25, bg = "black"))
text(TPR ~ FPR, data = dat, pos = 3, labels = dat$cutpoint)
abline(0, 1)
par(op)
答案 0 :(得分:3)
我想你可以手动计算它:
dat <- data.frame(tpr=c(0, .5, .7, .9, 1), fpr=c(0, .1, .2, .6, 1))
sum(diff(dat$fpr) * (dat$tpr[-1] + dat$tpr[-length(dat$tpr)]) / 2)
# [1] 0.785
您需要让tpr
和fpr
向量以0开头并以1结尾才能正确计算AUC。
答案 1 :(得分:2)
首先,我建议您访问当地的图书馆,找一本关于R的入门书籍。在您编写自己的代码和在互联网上找到的复制粘贴代码之前,有一个坚实的基础非常重要什么是手段充其量是冒险的。
关于你的问题,我相信(0,0)和(1,1)坐标是ROC曲线的一部分,所以我把它们包含在数据中:
ROCsdat <- data.frame(cutpoint = c(-Inf, 5, 7, 9, Inf), TPR = c(0, 0.56, 0.78, 0.91, 1), FPR = c(0, 0.01, 0.19, 0.58, 1))
我强烈建议您在R训练的这个阶段不要设置自己的梯形积分功能。它太容易出错,而且容易搞错一小(语法)错误。
相反,使用完善的集成代码,例如trapz
中的pracma
函数:
library(pracma)
trapz(ROCsdat$FPR, ROCsdat$TPR)
我认为你们大多数都是在策划,尽管我会稍微改写一下:
plot(TPR ~ FPR, data = ROCsdat, xlim = c(0,1), ylim = c(0,1), type="b", pch = 25, bg = "black")
text(TPR ~ FPR, data = ROCsdat, pos = 3, labels = ROCsdat$cutpoint)
abline(0, 1, col="lightgrey")
为了进行比较,假设您在auc1
和auc2
中有两个AUC。 if / else语法如下所示:
if (auc1 < auc2) {
cat("auc1 < auc2!\n")
} else if (auc1 == auc2) {
cat("aucs are identical!\n")
} else {
cat("auc1 > auc2!\n")
}