我必须通过视频进行本地化,其中一个人的肩膀在电影中。 对于如何达到这个目的有任何建议吗?
我考虑过角点检测或某种形状检测。但我还不确定接下来会发生什么。我们可以将视频视为图像序列(我写了这个,但我认为很明显)?
答案 0 :(得分:1)
幸运的是,肩膀通常贴在头上......
我使用了Dalal-Triggs算法(Wikipedia)来检测面向相机的所有人的头部和肩部。 基本上,您可以在标记头部+肩部的正例上训练线性SVM,在不包含这些身体部位的负面示例上训练线性SVM。描述符是梯度直方图(HOG),它告诉您在描述符的每个单元格中哪些边缘方向占优势。我发现它们的归一化方案在处理非均匀照明时非常重要。
通过足够的示例,线性SVM将为您提供可以解释为描述符的平面法线:您可以可视化正权重的含义,并看到它们勾勒出头部+肩部的轮廓。同样,负权重将属于身体外的区域,和/或与轮廓边缘正交的方向。
您可以在多个比例和宽高比上有效地对每个图像应用线性SVM分类器,并找到具有最佳响应的图像补丁。这应该给你头部和肩膀的位置(虽然不是很准确)