我将使用faster-rcnn训练我的数据集一堂课。我所有的图像均为1920x1080尺寸。我应该调整图像大小或裁剪图像,还是可以使用此尺寸进行训练? 而且我的物体很小(约60x60)。
在配置文件中,尺寸标注为min_dimension:600和max_dimension:1024,因此,我很困惑使用1920x1080尺寸的图像训练模型。
答案 0 :(得分:1)
如果对象很小,则将图像调整为较小的尺寸不是一个好主意。您可以将max_dimension更改为1920或2000,这可能会使速度降低一点。要裁剪图像,首先应考虑如何将对象放置在图像中。如果裁切会剪切很多对象,那么您将遇到很多截断的情况,这可能会对模型的性能产生负面影响。
答案 1 :(得分:0)
如果您坚持使用fast-rcnn来完成此任务,我个人建议:
更改配置文件中的输入高度和宽度,最大值和最小值,这对于成功执行数据集应该有效。
将原始区域建议参数(也应在配置文件中)更改为一定比例,并按1:1和60的比例缩放。
但是如果我是你,我想尝试:
在主干中添加一些快捷方式,因为它是一个小对象检测任务,需要高分辨率的功能。
切断fast-rcnn以增强性能,因为我只需要检测一个类是否为THE类(作为背景或其他类),并且输出应足以进行编码RPN阶段的信息。