应用错误收集

为什么对象检测CNN的边界框必须与图像边界平行？

时间：2017-12-21 09:59:19

标签： deep-learning object-detection

观察利用深度学习的对象识别的最新进展，例如MASK-RCNN或YOLO我注意到对象的边界框始终与图像边界平行。

这仅仅是由于提供的培训数据的符号，例如COCO，还是由于底层架构。看看Yolo或RCNN的最后一层 - 是否可以训练像图像中的物体一样旋转的矩形？

1 个答案:

答案 0 :(得分：2)

这些模型通常预测x和y的中心点，以及宽度和高度。这解释了一致的结果。如果训练数据提供了另一种形式的标签，那么也应该很容易学习其他边界框。