如何使用校准图和概率分布来改进分类模型?

时间:2017-05-15 07:17:20

标签: python machine-learning scikit-learn classification

我一直在研究分类问题。使用不同的分类器[见下图],我实现的AUC分数介于0.79-0.80之间,这不是很糟糕。但是,我正在努力提高分类器的性能。为了获得有关如何执行此操作的一些线索,我使用this tutorial生成了以下可视化。额外的树木似乎是最好的。但是,在此之后我不知道如何前进。例如,我可以使用此数字通知VotingClassifier吗?如果是这样,怎么样?我很感激任何建议。

enter image description here

1 个答案:

答案 0 :(得分:3)

ROC_AUC分数仅对概率的顺序敏感,而不是对其绝对值敏感。从字面上看,如果你将所有概率除以2,ROC_AUC得分将改变。

这意味着,概率校准对于改善AUC是无用的。你必须采用不同的方法。我不知道你已经尝试了什么,列表可能包括

  • 特色工程
  • 功能选择
  • GridSearch获取最佳超参数