应用错误收集

时间：2019-09-09 19:57:10

标签： deep-learning object-detection yolo data-augmentation faster-rcnn

我有大约2000 X 2000像素的图像。我尝试识别的对象的尺寸较小（通常在100 X 100像素左右），但是有很多。

我不想调整输入图像的大小，应用对象检测并将输出重新缩放为原始大小。原因是我处理的图像很少，我宁愿裁切（这会导致每个图像有多个训练实例），而不是缩小到较小的尺寸（这会使我为每个原始图像输入1张图像）。

是否存在一种复杂的方法或裁剪和重组图像以进行对象检测，尤其是在推断测试图像时？

对于训练，我想我只是取出随机的农作物，然后将其用于训练。但是对于测试，我想知道是否存在裁剪测试图像，应用对象检测并将结果组合回以获得原始大图像输出的特定方法。

答案 0 :(得分：0)

我想同时使用多个（我从未尝试过）网络是一个选择，对您来说，对每个1 * 1使用4 * 4（500 + 50 * 500 + 50），然后在输出处重新组装阶段（由于您提到目标很密集，可能是在边界处使用NMS）。

但这很奇怪。

您知道高分辨率图像检测的一种见识是使用“ U”形快捷方式更改主干，这可以解决一些问题而无需调整图像大小。请参阅U-Net。