快速入门-我正在尝试在tensorflow中构建YOLO模型。我无法找到用于训练YOLO对象检测和分类模型的y输出的形状。假设出于这个示例的缘故,预测值的形状为(13,13,2,7),其中存在13x13个像元,每个像元具有两个猜测,对应于7x1的形状。这个7x1的猜测是(is_obj_in_cell,x_mid,y_mid,宽度,长度,prob_cat,prob_dog)。
就我而言,有两种选择:
1)y的形状为(13,13,7),这似乎是有道理的,因为YOLO损失函数要求评估所有边界框预测的IoU(此示例中为2个猜测)
2)y的形状为(13,13,2,7),其中y会被“硬编码”,预测应与哪种类型的边界框相对应(即,宽度>长度,长度<=宽度等) 。)尽管这是有道理的,但这意味着对边界框预测的任何求和都没有意义,因为y是严格定义的。
有人可以帮我解决这个问题吗?