更快 - RCNN bbox /图像规范化

时间:2016-12-27 21:17:23

标签: deep-learning normalization caffe pycaffe

我在自定义数据集上玩py-faster-rcnn(大约3000个图像,7个不同的类,包括背景),并按照这些教程进行操作:

https://github.com/zeyuanxy/fast-rcnn/blob/master/help/train/README.md(Fast-RCNN教程) https://github.com/deboc/py-faster-rcnn/tree/master/help(更快 - RCNN教程)

我正在使用带有VGG16网络的end2end解决方案。 一切正常,期待我的结果,所以我有一些问题:

  • 图像和bbox注释需要哪种标准化?
  • 与上一个问题类似:有两个配置选项:BBOX_NORMALIZE_TARGETS和BBOX_NORMALIZE_TARGETS_PRECOMPUTED。我应该在训练前计算平均值和标准值并使用这些选项进行bbox标准化吗?
  • 我修改了cls_score和bbox_pred层的num_output(根据这个帖子:https://github.com/rbgirshick/py-faster-rcnn/issues/1),但是在end2end解决方案中也有rpn_cls_score和rpn_bbox_pred层。我应该修改这些的num_output吗?如果我应该如何计算7类的输出数量?

1 个答案:

答案 0 :(得分:4)

不,您不需要预先计算任何东西。在lib / roi_data_layer / roidb.py中,如果将BBOX_NORMALIZE_TARGETS_PRECOMPUTED设置为False,它将计算数据集的均值和标准差,否则,它将使用lib / fast_rcnn / config.py中指定的默认值。 RPN与多个类无关。它只将包含任何对象的区域视为正面,而将其他所有对象视为负面。