标签: imbalanced-data
我正在研究不平衡数据集的分类,其中少数案例在6万条记录的数据集中为1K。因此在火车数据集上尝试了SMOTE,Unsampling大多数类等所有平衡技术,并训练了分类器。然后我检查了精确召回曲线AUC以获取测试数据,但AUC没有任何改善。因此,我的问题是,当分类器在平衡火车数据集上训练时,分类器如何在不平衡测试数据上表现良好?我在这里想念什么吗?谢谢!!