我经常对图像特征上下文中术语描述符的含义感到困惑。描述符是点的局部邻域(例如浮点向量)的描述,还是描述输出描述的算法的描述符?那么,特征提取器的输出究竟是什么呢?
我一直在问自己这个问题很长一段时间,而我提出的唯一解释是描述符既是算法又是描述。特征检测器用于检测特征点。然而,功能提取器似乎没有任何意义。
请帮我澄清一下这种误解。 THX!
答案 0 :(得分:52)
要素检测器是一种算法,它可以拍摄图像并输出图像中重要区域的位置(即像素坐标)。一个示例是corner detector,它输出图像中角落的位置,但不会告诉您有关检测到的特征的任何其他信息。
要素描述符是一种算法,它采用图像并输出要素描述符 / 要素向量。特征描述符将有趣的信息编码为一系列数字,并作为一种数字“指纹”,可用于区分一个特征与另一个特征。理想情况下,这些信息在图像变换下是不变的,因此即使图像以某种方式变换,我们也可以再次找到该特征。一个例子是SIFT,它对关于局部邻域图像的信息进行编码,并对特征向量的数量进行渐变。您可以阅读的其他示例包括HOG和SURF。
编辑:当涉及到功能探测器时,“位置”也可能包含描述功能大小或比例的数字。这是因为“缩小”时看起来像角落的东西在“缩小”时可能看起来不像角落,因此指定比例信息很重要。因此,您不必仅使用(x,y)
对作为“图片空间”中的位置,而是可以在“比例空间”中将三(x,y,scale)
作为位置。
答案 1 :(得分:0)
对于descriptor,我理解为对图像上一个点的邻域的描述。也就是说,它是图像中的一个向量(描述图像中内容的视觉特征)。
例如,HOG(定向梯度直方图)中有一种方法称为图像梯度和空间/方向分箱。 extractHOGFeatures in Matlab 和 Classification using HOG 有视觉示例,可以更好地理解。