让我将问题描述如下。我有一个机器人在一个已知的2D板上移动。该板涂有多种颜色。这些画是较大的正方形,圆形和线条。机器人安装了一个摄像头,使其向下看向地板。由于我们可以校准相机,我们可以反转透视变换,通过这样做,我们观察整个板图像的子图像。 鉴于子图像(和电路板图像),本地化的最佳策略是什么?我只询问图像处理/计算机视觉部分,所以不需要谈论卡尔曼滤波器等。琐碎的方法是两个使用子图像作为模板,但由于我们还需要旋转不变性,我们需要搜索3D空间(tx,ty,theta)。不需要比例不变性,因为相机将处于恒定且已知的高度。一些子图像会有重复,但我们仍然需要知道这些重复的位置,因此输出应该是一些概率函数(p(tx,ty,theta))或一组候选。
算法应该很快,不必是实时的,但应该在标准PC上运行超过5-10fps。
董事会形象比比皆是6000x6000。子图像大约为500x500。颜色是固定的并且是已知的,因此我们可以很容易地将它们阈值/分类为几个(4-5)类。