如何在高分辨率图像上进行目标检测?

时间:2019-09-09 19:57:10

标签: deep-learning object-detection yolo data-augmentation faster-rcnn

我有大约2000 X 2000像素的图像。我尝试识别的对象的尺寸较小(通常在100 X 100像素左右),但是有很多。

我不想调整输入图像的大小,应用对象检测并将输出重新缩放为原始大小。原因是我处理的图像很少,我宁愿裁切(这会导致每个图像有多个训练实例),而不是缩小到较小的尺寸(这会使我为每个原始图像输入1张图像)。

是否存在一种复杂的方法或裁剪和重组图像以进行对象检测,尤其是在推断测试图像时?

对于训练,我想我只是取出随机的农作物,然后将其用于训练。但是对于测试,我想知道是否存在裁剪测试图像,应用对象检测并将结果组合回以获得原始大图像输出的特定方法。

1 个答案:

答案 0 :(得分:0)

我想同时使用多个(我从未尝试过)网络是一个选择,对您来说,对每个1 * 1使用4 * 4(500 + 50 * 500 + 50),然后在输出处重新组装阶段(由于您提到目标很密集,可能是在边界处使用NMS)。

但这很奇怪。

您知道高分辨率图像检测的一种见识是使用“ U”形快捷方式更改主干,这可以解决一些问题而无需调整图像大小。请参阅U-Net。