我正在学习kinect的工作原理。但我是这个领域的新手。有人请帮助我,以便更好地理解给定的公式
Fθ(I,x)= DI(X +(U / DI(X)) - DI(X +(V / DI(X)))
在描述中给出了哪里 dI(x)是图像I中像素x处的深度 参数Θ=(u,v)描述偏移u和v。 通过1 / dI(x)对偏移进行归一化可确保要素具有深度不变性:在物体上的给定点处,无论像素是近距离还是远离相机,都会产生固定的世界空间偏移。
我仍然无法理解整个公式,即像素x的深度是什么,偏移u,v,偏移u和v,偏移的归一化,...请帮助!
答案 0 :(得分:0)
对于像素X和偏移(U,V)都是向量而不是数字。
例如X是(100,200)。 U是(5,0)V是(0,10)。
偏移的归一化意味着如果该点靠近相机,则偏移较小,因为近区域中的深度值较大。在图片中可以看到,theta1大于theta2。 在这种情况下,它将是深度不变的。