训练YOLOv3模型架构CNN的输入图像的大小应该是多少?

时间:2020-07-29 18:50:58

标签: pytorch object-detection yolo cnn

我从头开始实现了YOLOv3,我计划使用MS-COCO权重来微调一些不同的数据。 我选择的数据集的图像尺寸为720 * 1280。

当我浏览YOLOv3纸时,第一层CONV2d层的filter_size = 3,步幅= 1,输出大小为256 * 256...。

有人可以告诉我YOLO培训部分在这里如何工作吗?

1 个答案:

答案 0 :(得分:0)

摘自Yolov3论文:

  • 如果要获得最佳的精度/ mAP,请在config中使用608 x 608作为输入图层大小。
  • 如果您希望以准确性为代价来获得良好的推理/速度,请使用320 x 320
  • 如果要使用平衡模型,请使用416 x 416

请注意,第一层会自动将图像的大小调整为Yolov3 CNN中第一层的大小,因此您无需将1280 x 720图像转换为输入层的大小。

建议您阅读以下内容:

  • 要了解Yolov3的工作原理,请阅读此blog帖子。
  • 要了解从原始site中读到的一些基本知识
  • 了解如何训练自定义对象检测器here
相关问题