我试图弄清楚如何解释yolov2输出。
我已经将yolo.cft和yolo.weights转换为Keras模型的yolo.h5。
然后我运行tableCell: {
border: '1px solid #dddddd',
padding: '8px',
},
,该输出的形状为(1,19,19,425)。
据我所知,这种形状的解释是:
图像被划分为19x19的网格单元格
425是5 x 85,其中5是锚点框的数量,而85是(isObject,Boxx,Boxy,Boxw,Boxh,class1,class2,...,class80)。
但是我不知道如何读取这些数据?还是在阅读之前与输出有关?
例如:
model.predict(img)
output_data = model.predict(img)
是否在anchor_box 0的框output_data[0][0][0][0]
中检查对象?然后[0, 0]
的数据与边界框详细信息相关联,output_data[0][0][0][1:4]
告诉我哪个类是框内的块?我的怀疑是对的还是我完全错了?
预先感谢 顺便说一句。我已使用cfg文件格式here