Oriented Gradients对象检测的直方图

时间:2013-06-18 02:59:23

标签: opencv image-processing

HOG在人体检测中很受欢迎。它可以用于检测图像中的杯子等物体。

我很抱歉没有提出编程问题,但我的意思是如果我可以使用hog来提取对象功能。

根据我的研究,我没有几天我觉得是的,但我不确定。

1 个答案:

答案 0 :(得分:32)

是的,HOG (Histogram of Oriented Gradients)可用于检测任何类型的对象,对于计算机而言,图像是一堆像素,您可以提取功能而不管其内容如何。但另一个问题是它的有效性。

HOG,SIFT和其他此类特征提取器是用于从图像中提取相关信息以更有意义的方式描述它的方法。当您想要检测具有数千(甚至数百万)像素的图像中的对象或人物时,简单地将具有数百万个数字的向量提供给机器学习算法是无效的

  1. 完成需要花费大量时间
  2. 我们不希望看到很多嘈杂的信息(背景,模糊,闪电和旋转变化)
  3. HOG算法具体地,从图像中的某些斑块创建边缘取向的直方图。补丁可以来自对象,人,无意义的背景或任何其他东西,并且仅仅是使用边缘信息描述区域的方式。如前所述,此信息可用于提供机器学习算法(如经典支持向量机),以训练能够将一种类型的对象与另一种对象区分开的分类器。

    HOG在行人检测方面取得如此大的成功的原因是因为一个人的颜色,衣服和其他因素可以大不相同,但行人的一般边缘保持相对恒定,特别是在腿部区域周围。这并不意味着它不能用于检测其他类型的对象,但它的成功可能因您的特定应用而异。 The HOG paper详细说明了这些描述符如何用于分类。

    值得注意的是,对于多种应用,使用金字塔方案可以大大提高HOG获得的结果。这可以如下工作:不是从图像中提取单个HOG矢量,而是可以将图像(或补丁)连续地分成几个子图像,从这些较小的分区中的每一个中提取单独的HOG矢量。然后可以重复该过程。最后,您可以通过将所有HOG向量连接到单个向量中来获取最终描述符,如下图所示。

    Pyramidal HOG

    这具有以下优点:在较大尺度中,HOG特征提供更多全局信息,而在较小尺度(即,在较小的细分中),它们提供更细粒度的细节。缺点是最终描述符向量变大,因此需要更多时间来提取和训练使用给定的分类器。

    简而言之:是的,您可以使用它们。