我真的很困惑YOLOv3中存在的卷积层数!
根据paper,他们使用的是 darknet- 53 ,他们没有提及任何进一步的细节或对该结构的补充!
但是,根据AlexeyAB的版本,它由 106 层组成! 此外, towardsdatascience 网站声称要在检测过程中添加额外的53层,但是这实际上意味着前53层仅用于特征提取吗?
所以我的问题是,这些额外的纸上未提及的53层是什么问题?哪儿来的?为什么?
答案 0 :(得分:0)
Darknet-53是Joseph Redmon等人开发的提取器的名称,它确实构成了YOLOv3的前53层。接下来的53层专用于调整输入的大小,串联和上采样,以准备分别在82、94和106层以三种不同的比例进行检测。第一层检测最大的对象,第二层检测中间的对象,最后一层检测所有剩余的对象(至少在理论上是这样)。
我认为这种分层结构的想法是进入YOLOv3的距离越远,它能够提取的高级信息越多。
答案 1 :(得分:0)
根据AlexeyAB(非常受欢迎的派生Darknet版本的创建者)https://groups.google.com/forum/?nomobile=true#!topic/darknet/9WppEzRouMU(此链接已被弃用)
Yolo有 75个cnn层(卷积层) +其他31个层(快捷方式,路径,上采样,yolo)=总共106层。
您可以在cfg文件中计算CNN层的总数,共有75个。另外请记住,Yolo V3确实以3个不同的比例进行检测,分别位于82,94,106层。