我无法理解YOLO v1研究论文中的以下文字:
"我们使用求和平方误差,因为它很容易优化, 但它并不完全符合我们的目标 最大化平均精度。它加权定位错误 同样的分类错误可能并不理想。 此外,在每个图像中,许多网格单元不包含任何网格单元 宾语。这推动了这些细胞的“信心”评分 朝向零,往往压倒细胞的梯度 确实包含对象。这可能导致模型不稳定, 导致训练在早期出现分歧。 为了解决这个问题,我们增加了边界框的损失 协调预测并减少信心损失 对不包含对象的框的预测。我们 使用两个参数lambda(coord)和lambda(noobj)来完成此任务。我们 设置lambda(coord)= 5和lambda(noobj)= .5"
"压倒性的"是什么意思?在第一段中,为什么我们会减少置信度预测的损失(特别是对于不包含任何对象的盒子,它是否已经不低)并从边界框预测中增加?
答案 0 :(得分:2)
有些细胞包含对象但没有。模型通常对网格单元中对象的缺失(零点附近的置信度)非常有信心,它使得来自这些单元格的梯度远大于包含对象但不具有巨大信心的单元格的梯度,它会压倒它们(即围绕它们) 0.7-0.8)。 因此,我们要考虑分类得分不那么重要,因为它们不是很“公平”,为了实现这一点,我们使得coords预测的权重大于分类。