我试图弄清楚如何从头开始创建YOLOv1模型,但我无法弄清楚训练数据应该是什么样子。我怀疑训练标签(地面实况)看起来像一个矩阵(7,7,5 * 2 + 10)
- 7x7代表预测网格
- 5是对象位置和置信度(总是等于1); x,y - 已知的盒子中心; h,v - 框高度和宽度
- * 2是因为每个单元格应该有水平和垂直框
- 10 - 是此位置中存在的类的单热编码
我不明白的是
- 是否将置信度== 1置于水平和垂直边界框?
- x和y是否应该是原始坐标(为输入调整大小)?
......或许我完全理解我的理解。有人有YOLO经验吗?