良好的ROC曲线但精确回忆曲线较差

时间:2015-10-23 03:49:04

标签: machine-learning scikit-learn performance-testing roc precision-recall

我有一些我不太了解的机器学习结果。我正在使用python sciki-learn,拥有大约14个功能的200多万个数据。对于精确回忆曲线,'ab'的分类看起来非常糟糕,但Ab的ROC看起来和大多数其他群体的分类一样好。有什么可以解释的?

enter image description here

enter image description here

1 个答案:

答案 0 :(得分:12)

阶级不平衡。

与ROC曲线不同,PR曲线对不平衡非常敏感。如果您针对不平衡数据优化分类器以获得良好的AUC,则可能会获得较差的精确回忆结果。