让我们说我有一个机器学习系统,它已经学会识别图像是否包含一个物体(例如汽车)。
我的问题如下,当系统接收到不同大小的图像时该怎么办?例如,训练集可以由1000x700像素的图像组成,但现实世界并不是那么统一,人们可以期待700x1000,700x400的图像......
第一个冲动是将图像的大小调整为与训练集大小相同,但感觉很脏并且不太有用。
我错过了一些明显的东西吗?此外,即使对于训练集,我也认为假设每个图像都具有固定大小(再次假设为1000x700像素)并不合理。
此外,如果使用滑动窗口技术,可能会出现同样的问题,因为要确定正确的窗口大小并不容易。
我想这一定是一个相对常见的问题,所以必须有一套通用的解决方案,任何想法?
答案 0 :(得分:3)
是。常见的解决方案是
现在......裁剪通常是通过一系列裁剪照片完成的:所有四个角和中心。在上面的(1)中,只有三个图像,而不是5个。