应用错误收集

为什么SSD培训不能给出准确的重新组合

时间：2018-05-03 05:43:57

标签： deep-learning caffe

我正在尝试使用single-shot multibox detector (SSD)检测包括颈部和肩部在内的人体头部。我有大约800张图像并训练了50,000次迭代。但在检测中，detection_eval在训练期间最大为0.29。

在部署中，没有准确的检测。可能是什么问题？我的矩形大约是40 x 40像素。

附上其中一张图片。

图像显示为here

对于SSD而言，训练图像数量太少或对象尺寸是否太小？可能是什么问题？

由于我的PC功能不强，我只使用了3个批量大小，会不会出问题？

在50,000次迭代中，它确实在从损失60到损失~0.9的训练中收敛。

1 个答案:

答案 0 :(得分：0)

我发现的问题是我的xmin，ymin，xmax，ymax的训练标签是标准化的浮动值。 SSD需要int（非标准化）值。然后，所有这些要素图都具有最小和最大尺寸，如conv4_3_norm_mbox_priorbox具有min_size：30.0和max_size：60.0。它们是基于min_dim = 300计算的。如果更改此min_dim值，则会更改所有最小/最大大小，如果这些大小不适合训练中的对象，则detection_eval值较低。