两周前我刚刚启动了TF Object Detection API,并设法训练模型识别自定义对象,在我的例子中是Mecanum轮。
以下是详细信息: - 训练图像数= 125 - 所有训练图像约为500 x 500(加减号) - 转学习 - 使用的型号= ssd_mobilenet_v1_coco - 批量大小= 2 - 总步数= 12715 - 损失大约是0.5000 - 2.5000,有时它会波动到10以上,我不知道为什么
这是结果.. first image令人鼓舞。
second image开始让我失望一点。我希望模型可以检测到四个(四个盒子)Mecanum轮。为什么呢?
然后,我怀疑我的训练模型有问题。我尝试使用示例测试图像third image和fourth image,然后我确信这完全不是我第一个瞄准的模型。
我一直在阅读post,我认为我们的问题非常相似(他设法解决了这个问题)。他提到输入图像需要小于600 x 1024,所以我尝试使用fifth image并且毫不奇怪,结果再次令人失望。
我通过sentdex完成了教程系列,在评论部分,我注意到有很多人也面临这个问题。那么,对于那里的所有专业人士,请解释并告诉我们现在该做什么。谢谢你提前。
**有人可以帮我编辑清单吗?为什么我不能把它变成一个一个列表? LOL
答案 0 :(得分:0)
125张图片?使用那么多图像,你将无法获得非常好的效果。如果您想确认这确实是问题,请尝试仅使用原始125张图像的子集进行训练。
例如,在10张图像上训练时输出有多糟糕?
使用50张图片时效果会更好吗?
当您使用125张图片时,它会变得更好吗?
如果随着数据集大小的增加精度提高,您可以推断并猜测1000张图像,您将能够做得更好。我猜这是你的问题。