需要帮助理解透视 - 三点

时间:2017-12-22 14:07:04

标签: computer-vision linear-algebra 3d-reconstruction

我正在关注P3P问题的this解释并提出一些问题。

  1. 在标有第1节的标题中,他们将图像平面点投影到单位球上。我不确定他们为什么这样做,这是模拟相机镜头吗?我知道在OpenCV中,我们首先计算相机的内在函数并将其计入solvePnP。这个单位范围是否有类似用途?<​​/ p>

  2. 同样在第1部分中,$ u ^ {'} _ x $,$ u ^ {'} _ y $和$ u ^ {'} _ z $来自哪里,他们是什么?如果我们投射到2D平面上,为什么我们需要第三个组件?我知道标准答案是“因为同质坐标”,但我似乎无法找到解释为什么我们使用它们或它们到底是什么。

  3. 同样在第1节中,“使用L2规范进行规范化”意味着什么,以及此步骤完成了什么?

  4. 我希望如果我理解第1节,我可以理解以下各节中的符号。

    谢谢!

1 个答案:

答案 0 :(得分:1)

以下是一些提示

  1. 投影到单位球体上与相机镜头无关。这只是一个数学变换,旨在简化P3P方程系统(我们试图计算其解决方案)。

  2. $ u&#39; _x $和$ u&​​#39; _y $是$(u,v)的坐标 - P $(此处为$ P =(c_x,c_y)$),由焦距$ f_x $和$ f_y $。相机光学中心$ P $的减法是原点到此点的转换。引入$ z $ coordinate $ u&#39; _z = 1 $将2D点$(u&#39; _x,u&#39; _y)$移动到由等式$ z = 1 $定义的3D平面上(与$ xy $平面平行的3D平面)。请注意,通过将点移动到平面$ z = 1 $,您现在可以更好地将它们视为通过$ P $和它们的3D线的交点。换句话说,这些点成为位于这些线上某处的3D点的2D平面上的投影(好吧,不仅仅是&#34;某处&#34;而是在焦距处,现在已经&#34;标准化&# 34;除以$ f_x $和$ f_y $后为1。同样,所有转换都旨在解决方程式。

  3. 所谓的$ L2 $规范只不过是Pithagoras定理的通常距离($ a ^ 2 + b ^ 2 = c ^ 2 $),只是它被使用了测量3D空间中的点之间的距离。