将大尺寸图像馈送到快速且更快的RCNN

时间:2017-08-28 07:17:25

标签: python performance keras object-detection

我有一个大小为1792 x 1792 x 3的大图像我想使用R-CNN使用说VGG-16(输入形状224,224,3),我使用一些区域建议算法,然后裁剪n(说500)来自大图像的区域然后将其调整为224,224,3,将其传递给VGG-16,然后使用回归头和分类头来获得所需的输出。但我对使用快速和快速R-CNN感到困惑。在图像通过VGG-16(来自最后一个池化层)并使用ROI池之后,它们都有这个提取感兴趣区域(ROI)。但我很困惑如何将1792 x 1792 x 3图像传递给输入形状为224,224,3的VGG-16。

P.S:

1)将图像从1792x1792x3重新调整为224x224x3,我认为这是一个坏主意,因为重新缩放时图像信息的损失非常高

2)我目前的想法是在VGG16之上添加一个卷积和池,以1792 x 1792 x 3作为输入并输出224x224x3的向量,以便它可以被馈送到网络中

0 个答案:

没有答案