在paper中,我可以理解SSD尝试从不同的要素图预测对象位置及其相关的类得分。
因此,对于每个层,可以对不同比例的锚(参考)框的数量进行不同的预测。
因此,如果一个卷积特征图具有5个参考框,则每个参考框应该有类别分数和bbx坐标。
我们通过在不同图层的要素图上滑动窗口(内核Ex:3 * 3)来进行上述预测。所以我不清楚的是从一个位置的滑动窗口到得分层的连接。
1。它只是以完全连接的方式将卷积窗口输出连接到得分层? 2.在将卷积窗口输出连接到得分层之前,我们还会对卷积窗口输出进行其他操作吗?
答案 0 :(得分:1)
通过卷积获得班级分数和bbx预测。这是 YOLO和SSD 之间的区别。 SSD不是完全连接的方式。我将解释如何采用分数函数。
以上是ssd特征提取器模型中的8 * 8空间大小的特征映射。 对于要素图中的每个位置,我们将预测以下
假设我们有k个默认(锚)框我们预测 *(4 + c) K
现在是棘手的部分。我们如何获得这些分数。
这些过滤器将预测(4 + c)标量。
因此,对于单个特征映射,如果存在我们在预测中引用它们的K数字锚框,
我们有* K *(4 + c)过滤器(空间位置为3 * 3)以滑动窗口的方式应用于要素图的每个位置。**
我们训练那些过滤器值!