更快的RCNN RPN的输入大小是多少? 我正在使用Tensorflow的对象检测API,该API使用更快的RCNN作为区域建议网络(RPN)和Inception作为特征提取器(根据配置文件)。 API在预测阶段使用在线方法,并分别检测每个输入图像。但是,我现在正尝试通过使用Tensorflow数据集API将图像批量添加到网络。 如您所知,要批量处理数据,首先我们需要将所有图像调整为相同大小。我认为调整图像大小的最佳方法是将它们精确调整为更快的RCNN的输入大小,以避免重复调整大小。现在我的问题是更快的RCNN RPN的输入大小是多少? 预先感谢
答案 0 :(得分:2)
这取决于在image_resizer
中的管道配置文件中指定的输入分辨率。
例如,对于在COCO数据集上训练的InceptionV2上的Faster R-CNN,请参见this config file。
指定的分辨率为600x1024。
另一方面,全卷积架构(例如RFCN,SSD,YOLO)不限于单个分辨率,即您可以将它们应用于不同的输入分辨率而无需修改架构。 但这并不意味着如果您在单一分辨率上进行训练,该模型将对它具有鲁棒性。