为每个类别分配具有不同数量数据的图像

时间:2017-02-15 15:34:19

标签: tensorflow keras keras-layer

我有7类图像需要分类。每个班级都有不同数量的样本。

  1. 75张图片
  2. 70张图片
  3. 98张图片
  4. 182张图片
  5. 146张图片
  6. 197张图片
  7. 150张图片
  8. 我最终将所有课程中的所有图像删除至70张图像(50次训练和20次验证)。使用Keras和生成器以及flow_from_directory方法,我能够对所有这些进行分类,但很明显我不会得到很好的准确性。我有一个计划在以后增加数据。

    我的问题是,我可以使用flow_from_directory方法为每个班级使用不同数量的训练数据吗?这种方法有任何潜在的缺点吗?

    例如:

    1. 55培训 - 20验证
    2. 50培训 - 20验证
    3. 78培训 - 20验证
    4. ......
    5. 由于

1 个答案:

答案 0 :(得分:0)

你可以,但最好是均衡每个班级的训练样本数量,或者分类器可能倾向于将图像分类到训练样本最多的班级。

说,也许你可以将第2课中的训练样本加倍(通过复制和粘贴)?

对于数据增强,您可以为训练样本添加噪音,例如添加高斯噪音,裁剪和调整图像大小等等。通过这样做,模型将更加健壮。