应用错误收集

如何在CNN中的回归头中输入边界框进行对象检测？

时间：2017-09-13 11:20:52

标签： python keras object-detection bounding-box

我正在从中心裁剪文档图像。我使用了VGG网络的预训练模型，并从最后一个卷积层的图像中提取特征。

我也从图像中获得了所有可能的边界框以及地面真实边界框。

以下是详细信息：共25张图片（演示目的）

要素地图大小：（25,512,14,14）

所有边框大小：（25，）对于前一个图像有55167个边界框，所以（55167,4）（这在某些图像中有所不同）

真正的边界框：（25,4）

现在如何在网络中提供此功能？

我还浏览了一些论文和资源。我不想要分类图层，因此我只想要框坐标。

我正在使用keras库。

1 个答案:

答案 0 :(得分：0)

您应该考虑使用本地化网络，而不仅仅是分类。 This repository还支持2阶段培训，以节省一些培训时间。