应用错误收集

快速入门-我正在尝试在tensorflow中构建YOLO模型。我无法找到用于训练YOLO对象检测和分类模型的y输出的形状。假设出于这个示例的缘故，预测值的形状为（13,13,2,7），其中存在13x13个像元，每个像元具有两个猜测，对应于7x1的形状。这个7x1的猜测是（is_obj_in_cell，x_mid，y_mid，宽度，长度，prob_cat，prob_dog）。

就我而言，有两种选择：

1）y的形状为（13,13,7），这似乎是有道理的，因为YOLO损失函数要求评估所有边界框预测的IoU（此示例中为2个猜测）

2）y的形状为（13,13,2,7），其中y会被“硬编码”，预测应与哪种类型的边界框相对应（即，宽度>长度，长度<=宽度等）。）尽管这是有道理的，但这意味着对边界框预测的任何求和都没有意义，因为y是严格定义的。

有人可以帮我解决这个问题吗？

YOLO对象检测，Y数据的形状

0 个答案: