Keras - 二进制分类

时间:2017-05-01 12:46:16

标签: machine-learning classification keras training-data

我目前正在尝试使用卫星图像来识别苹果园。我每个班级的代表性数据都面临一个小问题。

事实上我的问题是:

  

是否有可能在每个时代的“非苹果”课程中随机拍摄一些不同的图像,因为我有更多的论文(与“苹果”相比),我想增加网络分类的概率一个没有代表性的图像。

提前感谢您的帮助

1 个答案:

答案 0 :(得分:0)

这在Keras是不可能的。默认情况下,Keras将对您的训练数据进行随机播放,然后以小批量方式对其进行训练。但是,仍有一些方法可以重新平衡数据集。

您面临的不平衡训练数据问题非常常见。您有很多选择;我在下面列出几个:

  1. 您可以使用class_weight函数的model.fit()关键字调整班级的相对权重。
  2. 你可以" up-sample"你的"苹果"上课或"下采样"你的非苹果"在培训期间,两个班级都有相同数量的班级。
  3. 您可以生成"苹果"的合成图像。用于扩充数据集的类。为此,Keras的ImageDataGenerator课程特别有用。这个Keras tutorial很好地介绍了它的用法。
  4. 根据我的经验,我发现#2和#3最有用。 #1受到以下事实的限制:随机梯度下降的收敛在使用相差几个数量级和更小批量的类权重时会受到影响。

    杰森·布朗利(Jason Brownlee)将a list of tactics for dealing with imbalanced classes放在一起,这可能对你有用。