在自然图像中进行物体检测的步骤?

时间:2015-03-05 09:07:53

标签: image-processing machine-learning computer-vision object-detection object-recognition

我是计算机视觉的新手,谁能告诉我在自然图像中进行物体检测的步骤? (这里的对象是指徽标)。我根据自己的理解起草了以下步骤:

问题陈述:假设有20个参考徽标,给定自然图像,告诉图像中存在哪个徽标以及在哪个位置(边界框)。

Step1:收集包含相应徽标的许多(即100张)图片,并裁剪出徽标区域。因此,每个徽标有100个示例。此步骤的目的是在不同条件下处理徽标,例如照明,旋转等。

第2步:收集不包含任何徽标的随机图片。

Step3:提取功能,例如徽标和随机图片,使用SIFT功能。

Step4:现在,问题变成了一个多类别的分类问题。共有21个类,20个类对应20个徽标,1个类对应随机图像。

问题1: 使用哪种分类器?输入是什么,输出是什么?

Step5:鉴于测试图片,提取SIFT功能,使用所有功能作为输入?

问题2: 对于测试图像,请使用输入内容以及如何进行分类以确定其是否包含徽标,以及它是哪个徽标?

问题3: 如何确定检测到的徽标的位置?

问题4: 任何图片标注或裁剪工具?

如果我的程序不正确,请告诉我如何逐步完成此操作。在此先感谢!!

1 个答案:

答案 0 :(得分:0)

问题1:我可以建议您使用Support Vector Machine。对于具有小数据集的任务,它是简单但功能强大的分类器。对于大多数流行的编程语言来说,很容易找到SVM的实现。您应该为具有或不具有相同大小的徽标的修补程序提取SIFT(或任何其他)功能,并将它们用作分类器输入。地面实况分类标签是徽标名称和一些清洁补丁的标签。因此,如果您有20个徽标,则会有21个不同的班级标签。

问题2和3:您应该使用滑动窗口技术。它的本质在于你可以用一些步幅裁剪测试图像的补丁,并使用你的分类器来预测是否有一些徽标。您可以阅读更多相关信息,例如here

问题4:似乎该主题有答案:image labelling and annotation tool

一些建议:

  • Bootstrapping可以帮助您找到最难的分类器补丁而无需徽标
  • 使用交叉验证来确定SIFT,SVM或最佳补丁大小的最佳参数。
祝你好运!