视频中对象的分类(人类,动物,其他人(汽车等))

时间:2012-10-22 14:38:34

标签: image-processing machine-learning artificial-intelligence computer-vision object-detection

嗨,我是图像处理领域的新手。我的项目是对图像/视频中的对象进行分类。 输入是来自监控摄像机的图像/视频。我应该将对象分为三类。 1)人类2)动物3)其他(汽车)。我们可以考虑固定的背景。

任何人都可以为此目的建议任何经过验证的算法或论文或开源代码吗?幕后谷歌搜索是明显的解决方案,但总是有经验的眼睛总是有帮助的!

1 个答案:

答案 0 :(得分:13)

出于您的目的,我认为最佳选择是LatSVM,因为作者对MATLAB中的实现和已经训练过的探测器模型进行了推论。已经训练过的模型包括:

  • 飞机,船,巴士,汽车,自行车
  • 瓶子,电视,沙发
  • 鸟,猫,马,羊,狗

如果需要,在OpenCV中也有一个实现(在question中找到)。

其他检测器实施


查看行人检测中的以下调查:

  1. 行人检测:对现状的评估(2012)。
  2. 高级驾驶员辅助系统行人检测调查(2010年)。
  3. 艺术状态

    • 每秒100帧的行人检测。 [Benenson et al。,2012]提出的这项工作以最先进的精度[webpage]实现了高检测速度。
    • 使用受过严格训练的基于零件的模型进行物体检测又名 LatSVM 在PASCAL 2006,2007和2008上取得了良好的效果。这项工作并不仅适用于行人检测,还适用于汽车,猫,马,沙发。你真的应该看看这个[webpage]
    • 使用偏最小二乘分析进行人体检测。 [Schwartz et al。,2009] 提出使用偏最小二乘分析,它可以处理高维空间特征。

    经典作品

    以下作品有重要的贡献,并且在行人检测的每项工作中都有参考。 HOG特征,积分图像和拒绝级联被多个作品使用,包括[Benenson et al。,2012]的作品。

    • 用于人体检测的定向梯度直方图
    • 使用一系列定向梯度直方图进行快速人体检测