裁剪/缩放ImageNet图像

时间:2016-05-03 23:58:03

标签: neural-network crop imagenet

ImageNet图像的大小各不相同,但神经网络需要固定大小的输入。

一种解决方案是采用与图像中适合的一样大的裁剪尺寸,以图像的中心点为中心。这有效,但有一些缺点。通常情况下,图像中感兴趣对象的重要部分被剪切掉,甚至有些情况下正确的对象完全丢失,而另一个属于不同类的对象是可见的,这意味着您的模型将被训练错误。

另一种解决方案是使用整个图像并将其填充到每个图像具有相同尺寸的位置。这似乎会干扰训练过程,模型会学会在图像边缘附近寻找黑色的垂直/水平斑块。

通常做什么?

1 个答案:

答案 0 :(得分:4)

有几种方法:

  • 多种作物。例如,AlexNet最初是针对5种不同的作物进行培训的:中心,左上,右上,左下,右下。
  • 随机作物。只需从图像中获取一些随机作物,并希望神经网络不会有偏差。
  • 调整大小并变形。在不考虑宽高比的情况下将图像调整为固定大小。这会使图像内容变形,但会保留,但现在您确定没有内容被剪切。
  • 可变大小的输入。不要在可变大小的图像上裁剪和训练网络,使用像空间金字塔池这样的东西来提取可以与完全连接的图层一起使用的固定大小的特征向量。

您可以了解最新的ImageNet网络是如何接受培训的,例如VGG和ResNet。他们通常会详细描述这一步骤。