如何在图像中检测到特定目标“徽标”,何时可能会失真?

时间:2012-08-28 04:20:43

标签: image-processing computer-vision detection object-detection

假设我在我的数据库中拥有所有这些商业产品的徽标(它们只是图像),我在现实世界中拍摄这些徽标的照片,我该如何制作它以便我的程序可以在我的照片中检测到这样的徽标?约束是:

例如,一名足球运动员可能穿着一件带有可口可乐标志的衬衫,而且他的衬衫上面都有皱纹,这会使徽标扭曲。以下是它的外观示例。左边是原始版本,右边是扭曲版本:

logo test C

另一个例子是我直接拍摄一条街道的照片,在照片中,人行道上有一个麦当劳标志,从照片的角度来看,人行道上的麦当劳标志可能看起来像是“M”是的,而左边的'M'是原始图像:

logo test M

因此,考虑到这些限制,徽标在现实世界中可能会以任何方式扭曲,当然,如果照片中的徽标被扭曲到我们无法想象的程度,那么这超出了范围。但如果徽标有原始的“气味”,那么它应该是可能的,不是吗?

在这种情况下,如何检测照片中的徽标?我应该寻找哪些算法或方法?

1 个答案:

答案 0 :(得分:2)

这更像是一项机器学习任务。在尽可能多的扭曲视图中获取徽标的示例图像。然后训练一些物体探测器为您找到徽标。

您可能想要考虑的事情

  • 您需要大量的培训数据才能执行此操作。您可能希望生成合成(镜像)扭曲以获得足够的训练数据

  • 关于物体检测的文献丰富,有许多不同的算法。没有解决方案可以立即使用。尝试几种算法,我从一袋词开始,或SVM

  • 您可能需要执行“滑动窗口”检测样式才能在图像中找到徽标。将徽标视为您想要在一堆数据中检测到的2D图案

祝你好运!