我不知道锚框和边界框或提案区域之间的区别。我对这些定义感到困惑。 而且我不知道这些盒子在检测模型中的含义是什么,因为默认长度永远不会改变! 最后,我混淆了RCNN seris和Yolo seris是否都输出预测框位置(x,y,w,h)?或输出增量位置(ground truth_x - predict_x)/ prediction_w ...
答案 0 :(得分:1)
边界框 边界框是网络预测的框。这些预测框将覆盖在输入图像上,以便您可以直观地了解预测检测到矩形的位置和形状。也就是说,它们是您可以在this youtube video中看到的矩形。
锚框 我们可以对边界框的形状进行一些假设。例如,如果要检测人类,则应使用一些垂直矩形框搜索人类。它们是锚框。在训练和预测之前,将锚定框作为一些数字的列表馈入网络,这些数字是一系列的宽度和高度对:
锚= [1.08,1.19,3.42,4.41,6.63,11.38,9.42,5.11,16.62,10.52]
上面的列表定义了5个锚点框。我们可以将任意数量的锚框提供给网络。
这些值是通过训练过程中的统计数据确定的。
答案 1 :(得分:0)
锚框:预定义的界标矩形,用于边界框以拾取并使用偏移量来提供检测到的对象的位置
边界框:检测到的对象相对于锚框的预测矩形
基本上,该构想可与Snapchat摄像头等物体检测模型中使用的界标相媲美。根据自拍肖像的特征,在图像的特定区域上为网络预先确定一组节点,网络学习如何在将滤镜或蒙版应用于某些对象之前相对于馈入网络的不同面孔来偏移节点。视觉上的动感使用户真正兴奋