我想使用Tensorflow Object Detection API来识别一系列网络摄像头图像中的对象。对COCO数据集进行预训练的Faster RCNN models似乎是合适的,因为它们包含我需要的所有对象类别。
但是,我想在识别每个图像中相当小的对象时提高模型的性能。如果我理解正确,我需要在config file中编辑锚scales
参数,以使模型使用较小的边界框。
我的问题是:
我目前正在向模特提供1280x720张图像。大约200x150像素,我发现很难检测到物体。
答案 0 :(得分:5)
你不幸地需要重新训练,因为重量确实取决于锚的形状。
具有更高分辨率的特征图应该有所帮助(但会减慢过程),因此更改特征提取器以获得减小输入尺寸的特征图(步幅> 1的最大池通常会减小空间尺寸)或在初始图像缩放器中稍微放大图像。