应用错误收集

更快的RCNN + Inception v2输入大小

时间：2018-11-20 05:57:39

标签： tensorflow image-processing object-detection tensorflow-datasets

更快的RCNN RPN的输入大小是多少？我正在使用Tensorflow的对象检测API，该API使用更快的RCNN作为区域建议网络（RPN）和Inception作为特征提取器（根据配置文件）。 API在预测阶段使用在线方法，并分别检测每个输入图像。但是，我现在正尝试通过使用Tensorflow数据集API将图像批量添加到网络。如您所知，要批量处理数据，首先我们需要将所有图像调整为相同大小。我认为调整图像大小的最佳方法是将它们精确调整为更快的RCNN的输入大小，以避免重复调整大小。现在我的问题是更快的RCNN RPN的输入大小是多少？预先感谢

1 个答案:

答案 0 :(得分：2)

这取决于在image_resizer中的管道配置文件中指定的输入分辨率。例如，对于在COCO数据集上训练的InceptionV2上的Faster R-CNN，请参见this config file。指定的分辨率为600x1024。

另一方面，全卷积架构（例如RFCN，SSD，YOLO）不限于单个分辨率，即您可以将它们应用于不同的输入分辨率而无需修改架构。但这并不意味着如果您在单一分辨率上进行训练，该模型将对它具有鲁棒性。