如何在CNN中的回归头中输入边界框进行对象检测?

时间:2017-09-13 11:20:52

标签: python keras object-detection bounding-box

我正在从中心裁剪文档图像。我使用了VGG网络的预训练模型,并从最后一个卷积层的图像中提取特征。

我也从图像中获得了所有可能的边界框以及地面真实边界框。

以下是详细信息:共25张图片(演示目的)

要素地图大小:(25,512,14,14)

所有边框大小:(25,) 对于前一个图像有55167个边界框,所以(55167,4)(这在某些图像中有所不同)

真正的边界框:(25,4)

现在如何在网络中提供此功能?

我还浏览了一些论文和资源。我不想要分类图层,因此我只想要框坐标。

我正在使用keras库。

1 个答案:

答案 0 :(得分:0)

您应该考虑使用本地化网络,而不仅仅是分类。 This repository还支持2阶段培训,以节省一些培训时间。