我正在从中心裁剪文档图像。我使用了VGG网络的预训练模型,并从最后一个卷积层的图像中提取特征。
我也从图像中获得了所有可能的边界框以及地面真实边界框。
以下是详细信息:共25张图片(演示目的)
要素地图大小:(25,512,14,14)
所有边框大小:(25,) 对于前一个图像有55167个边界框,所以(55167,4)(这在某些图像中有所不同)
真正的边界框:(25,4)
现在如何在网络中提供此功能?
我还浏览了一些论文和资源。我不想要分类图层,因此我只想要框坐标。
我正在使用keras库。