平衡图像数据集的特定不平衡类别

时间:2021-04-03 10:31:34

标签: tensorflow keras deep-learning image-preprocessing tf.data.dataset

我有一个在基目录中有 12 个类的数据集。然而,这 12 个类别由若干数量的图像组成。 12 类图像的数量不一致,因此它对总精度的影响。因此,我是否应该将数据增强应用于数据量较少的特定类?

每个类的图像数据:

#Dummy Classes

[AAAA: 713
ABCD: 274
ACBD: 335
ADBC: 576
BBBB: 538
BACD: 607
BCAD: 253
BDAD: 257
CCCC: 463
CABD: 309
CBAD: 452
CDAB: 762]

因此,如果我必须应用数据增强来增加图像数据量较少的特定类中的数据量,结果,我已经应用了数据增强,但它并没有增加图像特定类中的数据。除此之外,我想用原始数据生成增强数据,这意味着输入和输出目录将相同。所以,有没有可能帮我解决这个问题?

笔记本:Google Colab 操作系统:Windows 10

特定(个别类)的增强代码:

from keras.preprocessing.image import ImageDataGenerator


datagen = ImageDataGenerator(
    rotation_range=45,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range = 0.2,
    zoom_range = 0.2, 
    horizontal_flip=True,
    fill_mode = 'nearest')

i = 0

for batch in datagen.flow_from_directory(directory = ('/content/dataset/AAAA'),
                                         batch_size = 64,
                                         target_size = (256, 256),
                                         color_mode = ('rgb'),
                                         save_to_dir = ('/content/dataset/AAAA'),
                                         save_prefix = ('aug'),
                                         save_format = ('png')):
  i += 1
  if i > 49:
    break

输出:Found 0 images belonging to 0 classes.

0 个答案:

没有答案
相关问题