训练Yolo使用已裁剪的图像检测我的自定义对象

时间:2019-05-01 00:39:51

标签: machine-learning computer-vision yolo darknet

我有很多形状,大小,光线,颜色等不同的“苹果”图像。这些“苹果”图像是不同角度的较大图像的一部分。

现在,我想训练Darknet来检测图像中的“苹果”。我不想经过注释过程,因为我已经裁剪出了准备好的苹果jpg图像。

我可以使用这些准备好的裁剪后的“苹果”图像来训练Darknet还是仍然需要经历注释过程?

2 个答案:

答案 0 :(得分:1)

在对象检测模型中,您可以注释图像中的对象,因为它可以了解对象在特定图像中的位置。如果您有一个仅包含苹果图像的整个数据集,则该模型将以某种方式学习,从而使您提供的每个图像都将包含唯一的苹果。因此,即使您提供“橙色”作为测试图像,它也可能会给苹果,因为它除了苹果外不知道其他类别。

因此有两点要考虑:

  1. 以这样的方式收集数据集:苹果,带有其他水果的苹果或其他对象。这将有助于模型清楚地了解苹果是什么。
  2. 由于边界框的坐标是检测的输入,尽管您可以将图像的常规尺寸指定为边界框,但是如上所述,它不能有效地学习。因此,在图像中包含多个对象然后进行注释,以便模型可以很好地学习

答案 1 :(得分:0)

您的答案与我们称为“数据增强”的过程有关。您可以用谷歌搜索其他人的行为。

由于所有Apple图像均已准备好裁剪,因此可以假定所有Apple图像均已按其完整尺寸进行了标记。然后收集一些背景图像,这些背景图像的大小都比您的任何Apple图像大。现在,您可以编写一个工具来随机选择一个苹果图像,并将其组合到您随机选择的背景中,以生成带有背景的“新”苹果图像。由于必须知道每个苹果图像的大小,因此您可以确定边界框的大小及其位置,然后生成其标记文件。