我有大约2000 X 2000
像素的图像。我尝试识别的对象的尺寸较小(通常在100 X 100
像素左右),但是有很多。
我不想调整输入图像的大小,应用对象检测并将输出重新缩放为原始大小。原因是我处理的图像很少,我宁愿裁切(这会导致每个图像有多个训练实例),而不是缩小到较小的尺寸(这会使我为每个原始图像输入1张图像)。
是否存在一种复杂的方法或裁剪和重组图像以进行对象检测,尤其是在推断测试图像时?
对于训练,我想我只是取出随机的农作物,然后将其用于训练。但是对于测试,我想知道是否存在裁剪测试图像,应用对象检测并将结果组合回以获得原始大图像输出的特定方法。
答案 0 :(得分:0)
我想同时使用多个(我从未尝试过)网络是一个选择,对您来说,对每个1 * 1使用4 * 4(500 + 50 * 500 + 50),然后在输出处重新组装阶段(由于您提到目标很密集,可能是在边界处使用NMS)。
但这很奇怪。
您知道高分辨率图像检测的一种见识是使用“ U”形快捷方式更改主干,这可以解决一些问题而无需调整图像大小。请参阅U-Net。