SSD对象检测中的锚框和偏移

时间:2018-06-03 03:52:17

标签: tensorflow keras deep-learning object-detection pytorch

如何计算SSD中物体检测的锚箱偏移量?据我所知,锚框是8x8特征图,4x4特征图或输出图层中任何其他特征图的框。

那么补偿是什么?

是边界框的中心与特定框的中心之间的距离,比如4x4特征地图吗?

如果我使用4x4功能图作为输出,那么我的输出应该是维度:

(4x4, n_classes + 4)

其中4代表我的锚箱坐标。 这4个坐标可以是:

(xmin, xmax, ymin, ymax)

这将对应于边界框的左上角和右下角。 那么为什么我们需要补偿呢?如果需要,我们如何计算它们呢?

任何帮助都会非常感激!

1 个答案:

答案 0 :(得分:0)

我们需要偏移量,因为那是我们默认锚点框时计算的结果,如果每个特征图单元格都使用ssd,则在特征图单元格上它们将具有预定义数量的不同比例的锚点框,我认为在本文中数字是6。

现在,因为这是一个检测问题,所以我们还将有地面真值边界框,在此粗略地,我们将锚框的IOU与GT框的IOU相比较,如果它大于阈值(例如0.5),我们将预测框偏移到那个锚框。