标签: deep-learning object-detection
观察利用深度学习的对象识别的最新进展,例如MASK-RCNN或YOLO我注意到对象的边界框始终与图像边界平行。
这仅仅是由于提供的培训数据的符号,例如COCO,还是由于底层架构。看看Yolo或RCNN的最后一层 - 是否可以训练像图像中的物体一样旋转的矩形?
答案 0 :(得分:2)
这些模型通常预测x和y的中心点,以及宽度和高度。这解释了一致的结果。如果训练数据提供了另一种形式的标签,那么也应该很容易学习其他边界框。