我正在实施Lowe的方法“SIFT”,用于查找和描述图像中的特征。
我找到了兴趣点,现在我必须对它们进行描述:使用Lowe的方法,我计算了关键点周围区域的幅度和梯度,并创建了一个高斯加权直方图,有36个区间,每个区域对应一个方向10度。对于每个关键点,都有一个直方图。每个箱是该方向上加权幅度的总和。一个例子来自aishack.in:http://www.aishack.in/static/img/tut/sift-orientation-histogram.jpg
最大容器大小的80%以内的容器,是一个新的关键点。在描述之后,它在论文中说:“最后,抛物线适合于最靠近每个峰值的3个直方图值,以插入峰值位置以获得更好的精度”。我不确定我能得到这个。
在我的理解中,它意味着该峰值的峰值,左侧和右侧值将具有抛物线拟合,如此(被警告!自由绘制)
http://i.stack.imgur.com/7V8pb.jpg
并且关键点的方向将是抛物线极值的位置。例如:如果抛物线安装在10-19,20-29和30-39(20-29为直方图峰值),则在30-39达到一个点时出现极值,则这将是该关键点的方向。我理解这个吗?这样,关键点的方向只能在36个方向内
另一个选择:与上面相同的想法,只有直方图不再是离散的:因此,parapola的极值将是一个连续值,并且该值被分配给关键点。
答案 0 :(得分:0)
抛物线拟合的想法是找到比分辨率更好的峰值。正如您在示例中看到的那样,峰值位于20-29(平均值为24.5),但10-19仓位高于30-39仓位。因此,精确峰值可能低于24.5。
你不能有一个非离散的直方图,它会击败直方图的点。你可以拥有的是重叠的bin:创建一个20-29的bin,还有一个21-30和22-31等的bin。所以值24将映射到10个bin,来自{{ 1}}到15-24
。
当你增加一个bin时,你不一定需要将它递增1.你也可以将一个bin增加一个可变的数量,例如:从给定值到bin边缘的距离。因此,24-35
会向bin 24
添加1,但为16-25
添加4。