我有一个简短的数据集,用于识别孟加拉字母(9600
数据用于训练,3000
用于测试)。
课程总数:50
。
这似乎是一小部分数据。
因此,我试图通过ImageDataGenerator
中的keras.preprocessing.image
来扩充数据集。运行良好。
现在,我正尝试通过GAN network
扩充数据以生成更大的数据集。
我已经阅读了一些基础知识并遵循了一些教程。就像deeplearning4j.org的this one一样,并紧随Github的code。
但是我不知如何生成增强数据。
也许,我缺少一些策略。有人可以告诉我使用GAN生成数据的策略吗?
我的策略是:
training
和test
数据集。Generator
和discriminator
。Generator
生成新图像real
和fake
图片