标签: machine-learning scikit-learn performance-testing roc precision-recall
我有一些我不太了解的机器学习结果。我正在使用python sciki-learn,拥有大约14个功能的200多万个数据。对于精确回忆曲线,'ab'的分类看起来非常糟糕,但Ab的ROC看起来和大多数其他群体的分类一样好。有什么可以解释的?
答案 0 :(得分:12)
阶级不平衡。
与ROC曲线不同,PR曲线对不平衡非常敏感。如果您针对不平衡数据优化分类器以获得良好的AUC,则可能会获得较差的精确回忆结果。