用于准备深度学习训练集的图像增强算法

时间:2016-10-18 15:13:38

标签: image-processing tensorflow deep-learning

为了准备大量的数据集来训练基于深度学习的图像分类模型,我们通常不得不依赖图像增强方法。我想知道通常的图像增强算法是什么,在选择时有什么考虑因素吗?

2 个答案:

答案 0 :(得分:1)

数据扩充的文献非常大,非常依赖于您的应用程序类型。 我想到的第一件事是星系竞赛的旋转和Jasper Snoeke的数据增加。

但实际上所有论文都有自己的技巧可以在特殊数据集上获得好成绩,例如在裁剪之前将图像拉伸到特定尺寸或其他任何事情,并按照特定的顺序进行。

更实际的是,训练像CIFAR或IMAGENET这样的模型使用随机作物和随机对比度,亮度扰动以及明显的翻转和噪声添加。

看看TF网站上的CIFAR-10教程,这是一个好的开始。加上TF现在有random_crop_and_resize(),这非常有用。

编辑:我引用的论文herethere

答案 1 :(得分:0)

这取决于您必须解决的问题,但大部分时间都可以解决:

  1. 旋转图像
  2. 翻转图像(X或Y对称)
  3. 添加噪音
  4. 所有以前的同时。