对YOLO流程感到困惑

时间:2018-08-08 02:51:05

标签: machine-learning computer-vision yolo

为了掌握这一概念,我阅读了Mauricio Menegaz撰写的这篇文章,并观看了Deeplearning.ai在YouTube上看到的video,但我对S x S x(B * 5 + C)部分。我知道S x S代表网格大小,5代表边界框的组件,C代表类。 B与锚框相同吗?如果万一我只想检测一个类别(例如车牌),那是否意味着只有1个B?

编辑 在将图像输入到神经网络之前,是否在图像上创建了边界框?

2 个答案:

答案 0 :(得分:1)

  

B与锚框相同吗?

是的,是的。 B是锚框的数量

  

如果我只想检测一个类别(例如车牌),那是否意味着只有1个B?

否,在这种情况下,C =1。但是,如果您事先知道需要检测的对象的宽高比,并且该比例在视点之间变化不大,则可能只需要与该比例匹配的锚框即可。 ,所以对于您的车牌,B也可以是1

但是,例如,如果您需要检测汽车,则可能需要更多的锚框,因为汽车的宽高比在视点之间会相差很大

答案 1 :(得分:0)

也许您可以看一下此实现: https://github.com/1991viet/Yolo-pytorch