为了掌握这一概念,我阅读了Mauricio Menegaz撰写的这篇文章,并观看了Deeplearning.ai在YouTube上看到的video,但我对S x S x(B * 5 + C)部分。我知道S x S代表网格大小,5代表边界框的组件,C代表类。 B与锚框相同吗?如果万一我只想检测一个类别(例如车牌),那是否意味着只有1个B?
编辑 在将图像输入到神经网络之前,是否在图像上创建了边界框?
答案 0 :(得分:1)
B与锚框相同吗?
是的,是的。 B是锚框的数量
如果我只想检测一个类别(例如车牌),那是否意味着只有1个B?
否,在这种情况下,C =1。但是,如果您事先知道需要检测的对象的宽高比,并且该比例在视点之间变化不大,则可能只需要与该比例匹配的锚框即可。 ,所以对于您的车牌,B也可以是1
但是,例如,如果您需要检测汽车,则可能需要更多的锚框,因为汽车的宽高比在视点之间会相差很大
答案 1 :(得分:0)
也许您可以看一下此实现: https://github.com/1991viet/Yolo-pytorch