与使用CNTK在Faster R-CNN网络中进行测试相比,我可以使用较小的图像进行训练吗?

时间:2019-02-15 15:20:24

标签: cntk

我正在使用CNTK在具有1920 * 1200图像的自定义数据集上训练Faster R-CNN网络。如果直接在这些大图像上进行训练,则会遇到运行时错误(RuntimeError:cuDNN失败9:CUDNN_STATUS_NOT_SUPPORTED)。要检测的物体很小(〜30 * 30像素),我发现了一个建议:“在训练阶段剪切图像(可以为训练和测试使用不同的缩放比例)”。 (What should be appropriate image size input to faster RCNN caffe model?)。

如果我将训练图像和测试图像都剪切为相同的大小(640 * 400),则效果很好。但是,如果要测试完整尺寸的图像,将训练图像切成640 * 400片并将FastRCNN_config.py中的条目更改为:

__C.IMAGE_WIDTH = 640
__C.IMAGE_HEIGHT = 400

__C.TEST.OUTPUT_IMAGE_WIDTH = 1920
__C.TEST.OUTPUT_IMAGE_HEIGHT = 1200

似乎存在某种缩放问题,因为输出检测结果被一起压缩在图像的左上方。

我不知道检测是否有效,但是边界框显示不正确或是否都失败了,但看起来都一样。

要对大于训练图像的图像进行检测,我还需要更改其他哪些设置?

1 个答案:

答案 0 :(得分:0)

我有一个非常相似的问题,目前还没有解决方案。我想训练和测试416x416的图像大小,以比较Yolo和Faster R-CNN。另外,我的预测图像都被压缩到测试图像的左上方,如所附的屏幕快照所示。如果有人知道出了什么问题,将不胜感激。 Image of falsy ROI predictions in upper left corner