我正在尝试收集我自己的图像检测训练数据集(尚未识别)。现在,我有4个课程,每个课程有750个图像。每个图像只是每个类的常规图像;然而,有些图像模糊或包含外部物体,例如不同的背景或其他因素(但没有任何可区分的东西)。使用该训练数据集,图像识别非常糟糕。
我的问题是, 1.训练图像集是否需要在各种背景/设置/环境中包含对象(我相信不是......)? 让我们说训练工作相当准确,我想知道对象在图像上的位置。我认为我无法使用图像识别找到位置,所以如果我使用边界框,我可以在代码中如何/在哪里看到边界框的位置?
提前谢谢!
答案 0 :(得分:0)
很难事先知道您的计划将为每个课程学习哪些功能。但话说回来,如果你看不见的图像会在同一个背景中,那么背景将不起作用。我建议在训练中增加数据;随机颜色失真,随机翻转,随机裁剪。
您无法在边界框所在的代码中看到。您必须先使用LabelMe工具在收集的数据中自行标注/注释它们。然后学习物体探测器。