应用错误收集

我正在比较Weka中的几个分类器，并将Zero-R作为基线结果。因为有些分类器有一些有趣的ROC曲线，所以我也看了一下。但是，我对Zero-R得到的结果感到困惑（我知道ROC曲线不是很有用）

我的数据集有122个真实和68个虚假实例，导致每个实例的零r预测为64.2％真。使用> = 0％的阈值，然后得到TPR = 122/122 = 1并且FPR = 68/68 = 1。使用> = 100％的阈值，得到TRP = 0/122 = 0，FPR = 0/68 = 0。这应该导致AUC为0.5。

到目前为止，一切都很有意义。

然而，weka在阈值0.64162（仍然小于122 /（122 + 68）= 0.64211）处得出第三个点，因此它确定有96个真阳性和56个误报。然后计算出AUC为0.4817。

有谁知道这第三点来自哪里？

关于WEKA中零R分类器的ROC曲线的第三点

0 个答案: