我有很多形状,大小,光线,颜色等不同的“苹果”图像。这些“苹果”图像是不同角度的较大图像的一部分。
现在,我想训练Darknet来检测图像中的“苹果”。我不想经过注释过程,因为我已经裁剪出了准备好的苹果jpg图像。
我可以使用这些准备好的裁剪后的“苹果”图像来训练Darknet还是仍然需要经历注释过程?
答案 0 :(得分:1)
在对象检测模型中,您可以注释图像中的对象,因为它可以了解对象在特定图像中的位置。如果您有一个仅包含苹果图像的整个数据集,则该模型将以某种方式学习,从而使您提供的每个图像都将包含唯一的苹果。因此,即使您提供“橙色”作为测试图像,它也可能会给苹果,因为它除了苹果外不知道其他类别。
因此有两点要考虑:
答案 1 :(得分:0)
您的答案与我们称为“数据增强”的过程有关。您可以用谷歌搜索其他人的行为。
由于所有Apple图像均已准备好裁剪,因此可以假定所有Apple图像均已按其完整尺寸进行了标记。然后收集一些背景图像,这些背景图像的大小都比您的任何Apple图像大。现在,您可以编写一个工具来随机选择一个苹果图像,并将其组合到您随机选择的背景中,以生成带有背景的“新”苹果图像。由于必须知道每个苹果图像的大小,因此您可以确定边界框的大小及其位置,然后生成其标记文件。