tensorflow - 在张量流模型中使用更快的RCNN进行小物体检测

我试图训练一个更快的rccn模型进行小数字检测。我使用了新发布的张量流object detection API，到目前为止，它已经从动物园中对预先训练好的faster_rcnn_resnet101_coco进行了微调。我所有的训练尝试都产生了高精度但低召回率的模型。在每个图像上的~120个对象（数字）中，仅检测到~20个对象，但是当检测到时，分类是准确的。（此外，我能够在我的裁剪图像上从头开始训练一个简单的回旋网，具有高精度，因此问题出在模型的检测方面。）原始图像中每个数字平均为60x30（可能大约是原始图像的一半）在将图像调整到模型之前调整图像大小。）以下是一个示例图像，其中包含我所看到的框：

对我来说奇怪的是它如何能够正确地检测相邻数字但完全错过了在像素尺寸方面非常相似的其余数字。

我已经尝试调整锚框生成和first_stage_max_proposals周围的超参数，但到目前为止还没有改进结果。这是我使用的示例config文件。我应该尝试调整哪些其他超参数？关于如何诊断问题的任何其他建议？我应该调查其他architectures还是我的任务看起来更快 - rccn和/或SSD？

在张量流模型中使用更快的RCNN进行小物体检测

2 个答案: