用于对象检测的可能的回归损失

时间:2019-01-03 13:59:29

标签: neural-network computer-vision object-detection bounding-box loss-function

许多对象检测算法将边界框预测为(xmin,ymin,xmax,ymax),表示边界框的左上角和右下角。此外,为避免梯度爆炸,大多数论文建议采用平滑的L1损耗或简单地使用L1损耗。

我的问题是,是否有其他方法的成功尝试?

例如

  • 预测框的左上角(x,y),宽度和高度。
  • 预测盒子的中心点(x,y),宽度和高度。
  • 预测框的中心点(x,y),大小和纵横比。
  • 预测中心点(x,y),大小和tan -1 (纵横比)

此外,其中某些选项可能对某些属性包括不同的重要性/权重。例如。找到合适的中心点和尺寸比合适的长宽比更重要。同样,明智的做法是将L1损耗用作中心点,而将L2损耗用作尺寸或纵横比。您是否知道有关此主题的任何研究?

谢谢。

0 个答案:

没有答案