我正在尝试在KITTI数据集上训练任何物体探测器,它具有奇怪的纵横比~370高度和1240宽度。在开始对模型动物园中的任何模型进行微调后,我无法获得良好的检测效果。我已经采用了样本coco配置,只是将图像缩放器参数更改为输入图像大小,并将类数更改为4.
我首先按照教程中的指示创建数据集的TFRecord文件,并检查文件以确认图像,标签和其他信息已正确保存为二进制格式,因此数据集不是问题。
当我用动物园的模型评估时,我得到了不错的检测。然而,一旦我尝试评估我自己训练的模型,检测结果就很糟糕,并且遍布整个图像。在训练期间,对于ssd~.4和rfcn~ .0004,损失也非常低。我认为这与图像尺寸有关,但我不确定。有谁知道为什么检测结果会在新的数据集上变得很糟糕?
以下是我从ssd模型中获得的边界框类型的示例:
示例检测
答案 0 :(得分:1)
我的问题在于TFRecord文件。边界框坐标和标签的密钥错误,因此网络正在接受培训#34;空的"没有边界框的图像。这也解释了为什么我的误差收敛到0,因为网络的权重只是被正则化压缩而没有从本地化到形成梯度的损失。