更快地训练图像大小

时间:2019-09-09 14:15:26

标签: tensorflow object-detection-api image-size faster-rcnn

我将使用faster-rcnn训练我的数据集一堂课。我所有的图像均为1920x1080尺寸。我应该调整图像大小或裁剪图像,还是可以使用此尺寸进行训练? 而且我的物体很小(约60x60)。

在配置文件中,尺寸标注为min_dimension:600和max_dimension:1024,因此,我很困惑使用1920x1080尺寸的图像训练模型。

2 个答案:

答案 0 :(得分:1)

如果对象很小,则将图像调整为较小的尺寸不是一个好主意。您可以将max_dimension更改为1920或2000,这可能会使速度降低一点。要裁剪图像,首先应考虑如何将对象放置在图像中。如果裁切会剪切很多对象,那么您将遇到很多截断的情况,这可能会对模型的性能产生负面影响。

答案 1 :(得分:0)

如果您坚持使用fast-rcnn来完成此任务,我个人建议:

  1. 更改配置文件中的输入高度和宽度,最大值和最小值,这对于成功执行数据集应该有效。

  2. 将原始区域建议参数(也应在配置文件中)更改为一定比例,并按1:1和60的比例缩放。

但是如果我是你,我想尝试:

  1. 在主干中添加一些快捷方式,因为它是一个小对象检测任务,需要高分辨率的功能。

  2. 切断fast-rcnn以增强性能,因为我只需要检测一个类是否为THE类(作为背景或其他类),并且输出应足以进行编码RPN阶段的信息。