即使训练图像中未包含旋转版本,TensorFlow对象检测模型也会输出正确的边界框预测。
这是对象检测模型的常规行为吗?如果是这样,什么(代码或概念的一部分)确保这种适应?
答案 0 :(得分:1)
可以模拟最简单的方法是通过数据集扩充,其中输入图像在每次传递到网络中之前都经过人工旋转,每次传递的数量不同。
通常将旋转限制为某个较小的值-例如-30
到30
度-而不是完全随机,因为图像通常具有某些标准方向,并且场景中的空间通常不是各向同性的(即,由于重力,向上的空间不同于侧面的空间)。
请注意,这些扩充不会使网络固有地旋转不变。但是,如果网络学习得很好,则应该学习近似的旋转不变性。
其他形式的增强包括左右翻转(但出于与上述相同的原因,不能上下翻转),调整大小和光度变化(如色相/饱和度/对比度操作)。在某些情况下,其中某些(或全部)不合适。例如,对于手写识别,符号本质上是不对称的,因此左右翻转是不合适的。