为什么对象检测CNN的边界框必须与图像边界平行?

时间:2017-12-21 09:59:19

标签: deep-learning object-detection

观察利用深度学习的对象识别的最新进展,例如MASK-RCNNYOLO我注意到对象的边界框始终与图像边界平行。

这仅仅是由于提供的培训数据的符号,例如COCO,还是由于底层架构。看看Yolo或RCNN的最后一层 - 是否可以训练像图像中的物体一样旋转的矩形?

1 个答案:

答案 0 :(得分:2)

这些模型通常预测x和y的中心点,以及宽度和高度。这解释了一致的结果。如果训练数据提供了另一种形式的标签,那么也应该很容易学习其他边界框。

相关问题