应用错误收集

训练Yolo使用已裁剪的图像检测我的自定义对象

时间：2019-05-01 00:39:51

标签： machine-learning computer-vision yolo darknet

我有很多形状，大小，光线，颜色等不同的“苹果”图像。这些“苹果”图像是不同角度的较大图像的一部分。

现在，我想训练Darknet来检测图像中的“苹果”。我不想经过注释过程，因为我已经裁剪出了准备好的苹果jpg图像。

我可以使用这些准备好的裁剪后的“苹果”图像来训练Darknet还是仍然需要经历注释过程？

2 个答案:

答案 0 :(得分：1)

在对象检测模型中，您可以注释图像中的对象，因为它可以了解对象在特定图像中的位置。如果您有一个仅包含苹果图像的整个数据集，则该模型将以某种方式学习，从而使您提供的每个图像都将包含唯一的苹果。因此，即使您提供“橙色”作为测试图像，它也可能会给苹果，因为它除了苹果外不知道其他类别。

因此有两点要考虑：

以这样的方式收集数据集：苹果，带有其他水果的苹果或其他对象。这将有助于模型清楚地了解苹果是什么。
由于边界框的坐标是检测的输入，尽管您可以将图像的常规尺寸指定为边界框，但是如上所述，它不能有效地学习。因此，在图像中包含多个对象然后进行注释，以便模型可以很好地学习

答案 1 :(得分：0)

您的答案与我们称为“数据增强”的过程有关。您可以用谷歌搜索其他人的行为。

由于所有Apple图像均已准备好裁剪，因此可以假定所有Apple图像均已按其完整尺寸进行了标记。然后收集一些背景图像，这些背景图像的大小都比您的任何Apple图像大。现在，您可以编写一个工具来随机选择一个苹果图像，并将其组合到您随机选择的背景中，以生成带有背景的“新”苹果图像。由于必须知道每个苹果图像的大小，因此您可以确定边界框的大小及其位置，然后生成其标记文件。