RetinaNet的焦损

时间:2019-01-31 13:30:50

标签: computer-vision

有人可以简单地解释一下RetinaNet中的失焦吗 从下面这2篇论文 用于目标检测的特征金字塔网络 密集物体检测的焦点损失

1 个答案:

答案 0 :(得分:2)

焦点损失可以定义为(注意:原始论文描述了二进制分类的损失,但是在这里我将其扩展为多类情况):

enter image description here

其中K表示类数;如果地面真相属于第i类,则yi等于1;否则,等于0。 pi是第i类的预测概率; γ∈(0,+∞)是聚焦参数; αi∈[0,1]是第i类的加权参数。损失与分类交叉熵相似,如果γ=0αi=1,则损失等效。那么,这两个附加参数的目的是什么?

正如原始论文所指出的那样,类不平衡是一个非常有问题的问题,它实际上限制了检测器的性能。这是因为图像中的大多数位置都是容易产生的负片(意味着可以很容易地被检测器归类为背景),并且不会产生有用的学习信号;更糟糕的是,由于它们占了输入的很大一部分,因此它们会使损失和计算的梯度不堪重负,并导致模型退化。为了解决这个问题,焦点损失引入了焦点参数γ,以减轻权重分配给容易分类的示例的损失。随着γ的值增加,这种影响也增加,并使网络更多地关注硬示例。

平衡参数α对于解决类不平衡也很有用。可以通过逆类频率(或作为超参数)进行设置,以便可以降低分配给背景类示例的损耗。

请注意,由于这两个参数相互交互,因此应一起选择它们。一般来说,随着γ的增加,α应当略微减小11。

以下是一篇详细介绍RetinaNet的帖子:https://blog.zenggyu.com/en/post/2018-12-05/retinanet-explained-and-demystified/