我正在使用在image-resizer标签中设置为最大尺寸300x400的更快的RCNN模型创建一个11类对象检测器。这是因为如果GPU更高,因为GPU是1050 Ti,4Gb版本,CUDA OOM错误会弹出,所以我有大约3800-3900 Mb的模型运行时训练记忆。
我遵循了erishima's步骤,并使用Pet的脚本和Dati Tran's对其进行了变更,以生成TFRecord文件。
步骤如下:
类的数据集是自定义的,图像/类的范围从2500到300.数据集没有对象方向的定义和图像中检测的难度,即使对象的每个可能的角度都存在于那些图像。
当我在217k步骤之后训练到损失值为.002时出现的问题是,无论是在视频还是图像上运行检测器,单个类都包围了所有其他类的对象。我没有尝试运行eval.py脚本,因为在这个设置上需要太长时间,而我无法真正看到类的mAP,但我认为它应该是冗余信息,因为问题应该在数据集中设置准备方法或在数据集本身。
当重新训练60k步时,问题仍然存在,但另一个课程包围了所有其他课程。
显示的警告是:
如果有人能告诉我一个正确的解决方法,我会非常感激。