小图像数据集的数据增强技术?

时间:2016-03-22 02:06:53

标签: image-processing machine-learning computer-vision neural-network deep-learning

目前我正在培训类似于Flickrlogos-32的小型徽标数据集,其中包含深度CNN。为了训练更大的网络,我需要更多的数据集,因此使用扩充。我现在做的最好的事情是使用仿射变换(特征标准化,特征中心,旋转,宽度高度偏移,水平垂直翻转)。但对于更大的网络,我需要更多的扩充。我试着在kaggle的国家数据科学碗forum上搜索,但无法获得太多帮助。给出here给出的某些方法的代码,但我不确定哪些方法有用。除了仿射变换之外,还有哪些其他(或更好)的图像数据增强技术可应用于此类(或任何一般图像)数据集?

2 个答案:

答案 0 :(得分:15)

可以找到一个很好的回顾here,关于数据增强的第1部分:即翻转随机作物颜色抖动以及灯光噪音

  

Krizhevsky et al.在2012年训练着名的Alex-Net时提出了PCA。幻想PCA改变了训练图像中RGB通道的强度。

或者你也可以看看Kaggle Galaxy Zoo的挑战:获胜者写了very detailed blog post。它涵盖了相同的技术:

  • 旋转,
  • 翻译,
  • 缩放,
  • 翻转,
  • 色彩扰动。

如上所述,他们也会实时地,即在训练期间"。

例如,这是Facebook的实用Torch implementationResNet培训)。

答案 1 :(得分:2)

我在my masters thesis, page 80收集了几种增强技巧。它包括:

  • 缩放,
  • 作物
  • 翻转(水平/垂直)
  • 轮换
  • 缩放
  • 剪切
  • 频道转换(rgb,hsv)
  • 对比度
  • 噪声,
  • 晕映