标签: python scikit-learn imblearn
我有一个48000的图像数据集,其中40k正常类和8k异常实例。为了使数据集平衡,我需要对多数类进行欠采样。尽管我使用了sklearn imblearn随机欠采样方法效果很好,但是在删除多数实例的同时,我需要保留行的顺序(图像序列)。