如何使用Python对图像数据集进行过采样?

时间:2018-01-30 23:20:15

标签: python-3.x machine-learning deep-learning computer-vision imblearn

我正在处理一个多类分类问题,其中包含不平衡的图像数据集(不同的类)。我尝试了{{1}}库,但它没有处理图像数据集。

我有一个属于3类图像的数据集,即A,B,C。 A有1000个数据,B有300个,C有100个。我想过采样B类和C类,这样我就可以避免数据不平衡。请告诉我如何使用python对图像数据集进行过采样。

1 个答案:

答案 0 :(得分:0)

感谢您的澄清。通常,您不会使用Python进行过采样。相反,您预处理数据库,复制短手课程。在您引用的情况下,您可以复制B类中的所有内容,并在C类中制作5个副本。这将为您提供1000:600:500的新余额,可能更适合您的训练程序。而不是原来的1400张图片,你现在洗牌2100。

这能解决您的问题吗?