我对数据集进行了预测分析,并绘制了ROC曲线。
我不太确定曲线的形状。它不是必须是波浪曲线。但是,从治疗的角度来看,我们可以确定这是有问题的。我获得了71%的准确度,对我来说还可以。但是我担心的是曲线的形状,这不是波浪形的。例如,如下所示。 (来自互联网。)
答案 0 :(得分:3)
看起来您只绘制了三个点。 ROC曲线的想法是显示当您调整决策阈值以建立每个点的性能时,FP / TP比如何变化。没有有关如何绘制此图形或具有哪些参数的信息,很难说更多。
一个典型的例子是调整攻击性级别-如果您有一个垃圾邮件扫描程序,它将在特定分数上归类为垃圾邮件,那么更改分数阈值将如何改变TP / FP率?因此,X轴可以有效地显示阈值设置(但可能会以某种方式拉伸),并且在每个点处的曲线都将显示干净集合中的样本数量是达到该阈值的FP,以及垃圾邮件集合中的数量将被正确阻止。
(“ Stretching”表示阈值设置可能不会线性映射到FP速率。如果阈值0.950和0.975之间什么都没有发生,则根本不会在x轴上绘制该间隔。x轴上的点是TP / FP速率发生变化的阈值;某些阈值可能彼此非常接近,其他相邻点可能对应于该阈值的较大跳动。)
好的ROC曲线下面有很大的面积。理想的ROC从0到1.00并保持在该水平,但是您并不需要图来帮助您决定如何部署解决方案。但是实际上,它们会以各种形式出现,从隐约渐近到左上(非常好)到对角直线(相当糟糕),甚至渐近到右下角(非常差;随机判决会更好)。有趣的一点是“膝盖”,TP速率的增长变慢,FP速率开始更快地增长(这是您应该停止增加阈值的位置)以及任何异常情况,尤其是那些打破单调的异常情况。
(在您的网络示例中,在TP 0.6附近有一个点,增加阈值只会增加FP。这是为什么?样本中是否存在偏斜,或者实施中存在问题?是否可以解决? ?)