目前我正在培训类似于Flickrlogos-32的小型徽标数据集,其中包含深度CNN。为了训练更大的网络,我需要更多的数据集,因此使用扩充。我现在做的最好的事情是使用仿射变换(特征标准化,特征中心,旋转,宽度高度偏移,水平垂直翻转)。但对于更大的网络,我需要更多的扩充。我试着在kaggle的国家数据科学碗forum上搜索,但无法获得太多帮助。给出here给出的某些方法的代码,但我不确定哪些方法有用。除了仿射变换之外,还有哪些其他(或更好)的图像数据增强技术可应用于此类(或任何一般图像)数据集?
答案 0 :(得分:15)
可以找到一个很好的回顾here,关于数据增强的第1部分:即翻转,随机作物和颜色抖动以及灯光噪音:
Krizhevsky et al.在2012年训练着名的Alex-Net时提出了PCA。幻想PCA改变了训练图像中RGB通道的强度。
或者你也可以看看Kaggle Galaxy Zoo的挑战:获胜者写了very detailed blog post。它涵盖了相同的技术:
如上所述,他们也会实时地,即在训练期间"。
例如,这是Facebook的实用Torch implementation(ResNet培训)。
答案 1 :(得分:2)
我在my masters thesis, page 80收集了几种增强技巧。它包括: