大图像上的物体检测训练

时间:2019-04-29 12:57:56

标签: machine-learning tensor yolo faster-rcnn

尝试通过在图像 4096 x 8192 像素上使用更快的 RCNN 来检测车牌。

我没有调整尺寸以进行训练,而是裁剪了图像的某些部分并标记了号码牌并进行了训练,这样可以正常工作,但无法在实际图像上检测到,只能在小图像上检测到。

请指导我完成这项工作的最佳方法是什么。我应该如何提供培训,以及如何在 faster_rcnn_inception_v2_pets.config 上进行配置。或者,如果您认为更快的RCNN不适用于这种工作,请提出一种更好的方法,我至少需要%80以上的精度。

我在Google上进行了很多搜索,但找不到任何处理8k以上图像的人。

我还要在下面附加一个示例图像。 https://ibb.co/NKWWd7q


我尝试通过Google云服务器对 4096 x 8192 像素的图像进行带注释的培训,单个批次的大小消耗了超过250gb的RAM。

亲切的问候。

1 个答案:

答案 0 :(得分:0)

以下是我的评论集:

与图像的其余部分相比,您的车牌似乎太小了。

尝试先提取汽车,例如YOLO,将其解压缩,然后再次运行您的车牌检测网络。请记住,您可能必须调整边界框(提取的汽车的大小)以适合您的网络输入大小。

使用YOLO can be found here检测汽车的示例。