ImageNet图像的大小各不相同,但神经网络需要固定大小的输入。
一种解决方案是采用与图像中适合的一样大的裁剪尺寸,以图像的中心点为中心。这有效,但有一些缺点。通常情况下,图像中感兴趣对象的重要部分被剪切掉,甚至有些情况下正确的对象完全丢失,而另一个属于不同类的对象是可见的,这意味着您的模型将被训练错误。
另一种解决方案是使用整个图像并将其填充到每个图像具有相同尺寸的位置。这似乎会干扰训练过程,模型会学会在图像边缘附近寻找黑色的垂直/水平斑块。
通常做什么?
答案 0 :(得分:4)
有几种方法:
您可以了解最新的ImageNet网络是如何接受培训的,例如VGG和ResNet。他们通常会详细描述这一步骤。