应用错误收集

SSD对象检测如何计算其分数和bbx位置？

时间：2017-08-12 18:21:55

标签： tensorflow deep-learning object-detection

在paper中，我可以理解SSD尝试从不同的要素图预测对象位置及其相关的类得分。

因此，对于每个层，可以对不同比例的锚（参考）框的数量进行不同的预测。

因此，如果一个卷积特征图具有5个参考框，则每个参考框应该有类别分数和bbx坐标。

我们通过在不同图层的要素图上滑动窗口（内核Ex：3 * 3）来进行上述预测。所以我不清楚的是从一个位置的滑动窗口到得分层的连接。

1。它只是以完全连接的方式将卷积窗口输出连接到得分层？ 2.在将卷积窗口输出连接到得分层之前，我们还会对卷积窗口输出进行其他操作吗？

1 个答案:

答案 0 :(得分：1)

通过卷积获得班级分数和bbx预测。这是 YOLO和SSD 之间的区别。 SSD不是完全连接的方式。我将解释如何采用分数函数。

以上是ssd特征提取器模型中的8 * 8空间大小的特征映射。 对于要素图中的每个位置，我们将预测以下

4 BBX坐标w.r.t默认框（以虚线显示）
每个默认框（c个班级）的课程分数

假设我们有k个默认（锚）框我们预测 *（4 + c） K

现在是棘手的部分。我们如何获得这些分数。

这里我们使用一组具有特征映射深度的卷积核。（通常为3 * 3）
由于有（4 + C）预测w.r.t 单锚框，就像我们有（4 + C）上面提到的具有深度特征图的内核。 所以它更像是一组过滤器。

这些过滤器将预测（4 + c）标量。

因此，对于单个特征映射，如果存在我们在预测中引用它们的K数字锚框，

我们有* K *（4 + c）过滤器（空间位置为3 * 3）以滑动窗口的方式应用于要素图的每个位置。**

我们训练那些过滤器值！