标签: neural-network computer-vision object-detection bounding-box loss-function
许多对象检测算法将边界框预测为(xmin,ymin,xmax,ymax),表示边界框的左上角和右下角。此外,为避免梯度爆炸,大多数论文建议采用平滑的L1损耗或简单地使用L1损耗。
我的问题是,是否有其他方法的成功尝试?
例如
此外,其中某些选项可能对某些属性包括不同的重要性/权重。例如。找到合适的中心点和尺寸比合适的长宽比更重要。同样,明智的做法是将L1损耗用作中心点,而将L2损耗用作尺寸或纵横比。您是否知道有关此主题的任何研究?
谢谢。