Tensorflow:在自定义数据集上训练SSD Mobilenet的问题

时间:2018-04-29 07:23:50

标签: tensorflow neural-network training-data

我正在尝试使用Tensorflow对象检测API在自定义数据集上训练SSD Mobilenet网络。我的数据集包含大约90000张图像,其中80%是训练(约75k),其余验证(eval)。

我的数据集有12个类,它最初与YOLO一起使用,所以我使用这个converter来创建训练和验证TFRecord文件。我确保我的标签文本是正确的,从类ID 1等开始。我使用模型动物园中的ssd-mobilenet-v1预训练检查点,并根据需要更改配置文件以指向我的记录文件,并设置num_examples为评估我拥有的验证图像的数量。我正在使用对象解析API的Tensorflow 1.4.1和v1.5。

在培训窗口中似乎没有任何明显错误,但网络根本没有正确地学习对象。从Tensorboard的这些图片可以看出这一点。

screenshot from 2018-04-28 08-57-20

screenshot from 2018-04-28 08-58-05

它似乎只是在一定程度上检测到了2/12类,即使这样,即使在50k步之后也很难对分类感到困惑。损失似乎也在波动,并没有真正下降。我希望得到一些关于如何调查训练中可能出错的建议。

0 个答案:

没有答案