我有7类图像需要分类。每个班级都有不同数量的样本。
我最终将所有课程中的所有图像删除至70张图像(50次训练和20次验证)。使用Keras和生成器以及flow_from_directory方法,我能够对所有这些进行分类,但很明显我不会得到很好的准确性。我有一个计划在以后增加数据。
我的问题是,我可以使用flow_from_directory方法为每个班级使用不同数量的训练数据吗?这种方法有任何潜在的缺点吗?
例如:
由于
答案 0 :(得分:0)
你可以,但最好是均衡每个班级的训练样本数量,或者分类器可能倾向于将图像分类到训练样本最多的班级。
说,也许你可以将第2课中的训练样本加倍(通过复制和粘贴)?
对于数据增强,您可以为训练样本添加噪音,例如添加高斯噪音,裁剪和调整图像大小等等。通过这样做,模型将更加健壮。