应用错误收集

时间：2016-09-19 23:52:55

标签： machine-learning computer-vision

让我们说我有一个机器学习系统，它已经学会识别图像是否包含一个物体（例如汽车）。

我的问题如下，当系统接收到不同大小的图像时该怎么办？例如，训练集可以由1000x700像素的图像组成，但现实世界并不是那么统一，人们可以期待700x1000,700x400的图像......

第一个冲动是将图像的大小调整为与训练集大小相同，但感觉很脏并且不太有用。

我错过了一些明显的东西吗？此外，即使对于训练集，我也认为假设每个图像都具有固定大小（再次假设为1000x700像素）并不合理。

此外，如果使用滑动窗口技术，可能会出现同样的问题，因为要确定正确的窗口大小并不容易。

我想这一定是一个相对常见的问题，所以必须有一套通用的解决方案，任何想法？

答案 0 :(得分：3)

是。常见的解决方案是

现在......裁剪通常是通过一系列裁剪照片完成的：所有四个角和中心。在上面的（1）中，只有三个图像，而不是5个。