电视标识自动查找/定位/检测的建议或方法

时间:2017-08-21 02:41:23

标签: algorithm opencv image-processing computer-vision video-processing

通常,徽标检测装置会找到徽标并识别徽标。一些常见的工作使用SIFT / SURF匹配方法将这两个步骤结合在一起,详见

但是,如果徽标很小且模糊,结果很差,而且耗费时间;我想分开这两个步骤,首先找到徽标在视频中的位置;然后使用模板匹配或其他方法识别徽标,例如:

我的问题主要集中在视频中自动查找徽标。我尝试了两种方法:

  • 亮度法。电视屏幕上的标志通常在演出时总是在那里,我随机选择一个帧列表并在帧之间做差异,标识区域往往是0;我做了一些0阈值亮度的统计,以确定pix是否是徽标。当节目具有静态背景时,此方法通常表现良好但失败。
  • 边缘方法。可能,如果徽标在那里,边界往往是显而易见的。我像Brightness方法一样进行统计工作,但边缘有时不稳定,例如非常明亮的背景。

除筛选或模板匹配外,是否有任何建议或现有技术方法可自动查找徽标区域和任何其他徽标识别方法?

2 个答案:

答案 0 :(得分:1)

让我们假设您在手动之前已知的徽标列表,您可以访问所有徽标的示例(视频流/帧)。

2017年您的问题的答案是培训徽标分类器,很可能是深层神经网络。

如果有足够的训练数据,如果电视观众可识别它,它将能够检测到它。它将能够处理局部模糊和强度变化(这可能会阻碍亮度和边缘的“经典”图像处理方法)。

OpenCV可以从多个框架(如Caffe,Torch和TensorFlow)加载和运行网络模型,因此您可以使用其中一个预先训练的模型或自己训练一个。

答案 1 :(得分:0)

您也可以在这里尝试 Tensorflow 的对象检测 API:https://github.com/tensorflow/models/tree/master/research/object_detection

此 API 的好处在于它包含对象检测和分类方面的最先进模型。 tensorflow 提供的这些模型可以免费训练,其中一些模型承诺会产生相当惊人的结果。我已经为我工作的公司训练了一个模型,它在从图像和视频流中检测 LOGO 方面做得非常出色。你可以在这里查看更多关于我的工作:https://github.com/kochlisGit/LogoLens

电视的问题是 LOGO 可能不是静态的,而是沿着框架移动。这将导致运动模糊效果,这可能会使您的分类器混淆或看不到 LOGO。但是,一旦找到徽标,您就可以使用对象跟踪算法来跟踪徽标(例如深度排序)