我正在比较Weka中的几个分类器,并将Zero-R作为基线结果。因为有些分类器有一些有趣的ROC曲线,所以我也看了一下。但是,我对Zero-R得到的结果感到困惑(我知道ROC曲线不是很有用)
我的数据集有122个真实和68个虚假实例,导致每个实例的零r预测为64.2%真。使用> = 0%的阈值,然后得到TPR = 122/122 = 1并且FPR = 68/68 = 1。使用> = 100%的阈值,得到TRP = 0/122 = 0,FPR = 0/68 = 0。这应该导致AUC为0.5。
到目前为止,一切都很有意义。
然而,weka在阈值0.64162(仍然小于122 /(122 + 68)= 0.64211)处得出第三个点,因此它确定有96个真阳性和56个误报。然后计算出AUC为0.4817。
有谁知道这第三点来自哪里?