SSD对象检测如何计算其分数和bbx位置?

时间:2017-08-12 18:21:55

标签: tensorflow deep-learning object-detection

paper中,我可以理解SSD尝试从不同的要素图预测对象位置及其相关的类得分。 SSD

因此,对于每个层,可以对不同比例的锚(参考)框的数量进行不同的预测。

因此,如果一个卷积特征图具有5个参考框,则每个参考框应该有类别分数和bbx坐标。

我们通过在不同图层的要素图上滑动窗口(内核Ex:3 * 3)来进行上述预测。所以我不清楚的是从一个位置的滑动窗口到得分层的连接。

1。它只是以完全连接的方式将卷积窗口输出连接到得分层? 2.在将卷积窗口输出连接到得分层之前,我们还会对卷积窗口输出进行其他操作吗?

1 个答案:

答案 0 :(得分:1)

通过卷积获得班级分数和bbx预测。这是 YOLO和SSD 之间的区别。 SSD不是完全连接的方式。我将解释如何采用分数函数。

以上是ssd特征提取器模型中的8 * 8空间大小的特征映射。 对于要素图中的每个位置,我们将预测以下

  • 4 BBX坐标w.r.t默认框(以虚线显示)
  • 每个默认框(c个班级)的课程分数

假设我们有k个默认(锚)框我们预测 *(4 + c) K

现在是棘手的部分。我们如何获得这些分数。

  • 这里我们使用一组具有特征映射深度的卷积核。 (通常为3 * 3)
  • 由于有(4 + C)预测w.r.t 单锚框,就像我们有(4 + C)上面提到的具有深度特征图的内核。 所以它更像是一组过滤器。

这些过滤器将预测(4 + c)标量。

因此,对于单个特征映射,如果存在我们在预测中引用它们的K数字锚框,

我们有* K *(4 + c)过滤器(空间位置为3 * 3)以滑动窗口的方式应用于要素图的每个位置。**

我们训练那些过滤器值!