应用错误收集

时间：2010-01-15 21:38:29

标签： machine-learning computer-vision image-recognition

有谁知道最近在图像中识别徽标的学术工作？请仅在您熟悉此特定主题时回答（我可以在Google上搜索“徽标识别”，非常感谢）。任何对计算机视觉有所了解并且已完成物体识别工作的人也欢迎发表评论。

更新：请参考算法方面（您认为哪种方法是合适的，本领域的论文，是否应该对现实世界数据（和效率考虑因素）起作用（并且已经过测试）而不是技术方面（使用的编程语言或是否与OpenCV ...）有关图像索引和基于内容的图像检索的工作也可以提供帮助。

答案 0 :(得分：37)

它应该起作用，因为徽标形状通常是不变的，因此提取的特征应该很好地匹配。

工作流程如下：

检测角落（例如Harris角落探测器） - 对于Nike徽标，它们是两个尖端。
计算描述符（如SIFT - 128D整数向量）
在训练阶段记住它们;在匹配阶段找到训练期间获得的数据库中每个特征的最近邻居。最后，你有一组匹配（其中一些可能是错误的）。
使用RANSAC播出错误的匹配。因此，您将获得描述从理想徽标图像转换到您找到徽标的图形的矩阵。根据设置，您可以允许不同类型的变换（只是翻译;平移和旋转;仿射变换）。

P.S。

我以为你想在照片中找到标志，例如找到所有的百事可乐广告牌，所以它们可能会被扭曲。如果您需要在屏幕上找到电视频道徽标（以便它不会旋转和缩放），您可以更轻松地进行（模式匹配等）。
传统的SIFT不考虑颜色信息。由于徽标通常具有恒定的颜色（尽管确切的颜色取决于闪电和相机），您可能需要以某种方式考虑颜色信息。

答案 1 :(得分：31)

我们在现实世界的图像中进行了徽标检测/识别。我们还创建了一个数据集FlickrLogos-32，并将其公之于众，包括数据，基础事实和评估脚本。

在我们的工作中，我们将徽标识别视为检索问题，以简化多类识别，并允许此类系统轻松扩展到许多（例如数千个）徽标类。

最近，我们开发了一种名为 Bundle min-Hashing 的捆绑技术，该技术将多个本地特征的空间配置聚合为高度独特的功能包。捆绑表示可用于检索和识别。请参阅以下示例热图以获取徽标检测：

enter image description here

您可以找到有关内部操作，方法的潜在应用，性能实验的更多详细信息，当然还有许多参考文献[1] [2]中的相关工作。

答案 2 :(得分：7)

致力于：体育视频数据库中的商标匹配和检索得到论文的PDF：http://scholar.google.it/scholar?cluster=9926471658203167449&hl=en&as_sdt=2000

我们使用SIFT作为商标和图像描述符，并使用标准化阈值匹配来计算模型和图像之间的距离。在我们的最新工作中，我们已经能够使用元模型大大减少计算，创建评估存在于同一商标的不同版本中的SIFT点的相关性。

我会说，由于目前使用的电视标准的视觉质量非常糟糕，因此使用视频比处理照片更难。

马

答案 3 :(得分：4)

我参与了一个项目，我们必须做一些非常相似的事情。起初我尝试使用Haar Training技术使用这个软件

它有效，但不是满足我们需求的最佳解决方案。我们的源图像（我们在寻找徽标的地方）是固定大小的，只包含徽标。因此，我们能够使用具有已知良好匹配的cvMatchShapes并比较返回的值以认为匹配良好。