Cityscapes Trafficsigns没有使用TF Object Detection API进行箱形或面罩检测

时间:2018-08-22 12:37:42

标签: python tensorflow tensorboard object-recognition object-detection-api

对于所有的想法,技巧或链接,我将不胜感激:

使用TF 1.10和最近的object detection-API (github, 2018-08-18),我可以使用PETS数据集以及我自己的概念证明数据集:Mask result

进行盒形和蒙版预测

但是在对城市景观交通标志(单班)进行培训时,我很难获得 any 结果。我已经修改了锚以尊重较小的对象,并且RPN似乎至少在做有用的事情RPN after 17k steps

无论如何,框预测器根本不起作用。这意味着我根本没有任何盒子-不需要面具。


我的管道大部分甚至与样本配置完全相同。 因此,我希望是特定类型的数据有问题还是有bug。

您是否有任何提示/链接(如何)

  • 使用2阶段或3阶段可视化RPN结果吗? (仅使用一个阶段即可,但如何迫使它执行?)
  • 先训练RPN,然后再继续训练?
  • 调查箱子在哪里/为什么丢失? (预测的得分为,而评估的得分为分类错误)

1 个答案:

答案 0 :(得分:0)

解决方案最终是多个问题的组合:

Results already showing after only a few epochs

  • 折旧了参数from_detection_checkpoint: true,并将其替换为fine_tune_checkpoint_type: 'detection'。但是,在没有任何框架的情况下,该框架似乎默认为'classification',这似乎破坏了对象检测框架的整体思想。这次不要依赖默认值。
  • 我的数据准备得不够好。我的箱子的宽度+ /高度为零(无论出于何种原因)。我还删除了断开连接的实例的掩码。

  • keep_aspect_ratio_resizerrandom_crop_imagerandom_coef: 0.0一起使用确实不会允许完整分辨率,因为似乎在调整器之前已应用了调整大小随机裁剪。现在,我将输入图像分成(垂直)条纹(以节省内存),并使用小的min_area来应用random_crop,这样它根本就不会跳过小的特征。现在,我也可以考虑存储使用情况了,允许max_area: 1和一个随机系数> 0。

  • 一个潜在的问题还源于我到目前为止只考虑过一个班级的事实。对于框架或网络中的激活功能,这可能都是一个问题。但是,结合其他问题,此更改似乎不会引起任何其他问题-至少是这样。

  • 最后但并非最不重要的一点是,我将源代码更新为2018年10月2日,但没有详细介绍所有修改。

我希望其他人可以从我的发现中节省时间和麻烦。