python - 将大尺寸图像馈送到快速且更快的RCNN

我有一个大小为1792 x 1792 x 3的大图像我想使用R-CNN使用说VGG-16（输入形状224,224,3），我使用一些区域建议算法，然后裁剪n（说500）来自大图像的区域然后将其调整为224,224,3，将其传递给VGG-16，然后使用回归头和分类头来获得所需的输出。但我对使用快速和快速R-CNN感到困惑。在图像通过VGG-16（来自最后一个池化层）并使用ROI池之后，它们都有这个提取感兴趣区域（ROI）。但我很困惑如何将1792 x 1792 x 3图像传递给输入形状为224,224,3的VGG-16。

P.S：

1）将图像从1792x1792x3重新调整为224x224x3，我认为这是一个坏主意，因为重新缩放时图像信息的损失非常高

2）我目前的想法是在VGG16之上添加一个卷积和池，以1792 x 1792 x 3作为输入并输出224x224x3的向量，以便它可以被馈送到网络中

将大尺寸图像馈送到快速且更快的RCNN

0 个答案: