我训练CNN,许多作者提到从原始图像的中心随机裁剪图像,数据增加2048倍。任何人都可以详细说明它是什么意思吗?
答案 0 :(得分:2)
我相信你指的是ImageNet Classification with Deep Convolutional Neural Networks数据增强方案。他们的数据增强方案的2048x方面如下:
所以我猜他们如何得到2048x数据增强因子:
问题的中心裁剪方面源于原始图像的大小不同。所以作者所做的是他们重新缩放每个矩形图像,使得最短边的尺寸现在为256,并且他们从中获取中心裁剪,从而将整个数据集重新缩放到256x256。一旦他们将所有图像重新调整为256x256,他们就可以执行上述(最多)-2048x数据增强方案。