我正致力于将2D图像转换为3d环境。从横向运动的视频中收集图像。然后将图像一个接一个地放置,这样就很容易找到两个图像之间的对应关系。这称为时空体积。
接下来,我从时空体积中切片。该切片称为极线平面图像。
使用Epipolar Plane Image,我想计算场景中物体的深度并制作3D环境。我列出了参考文献,但我无法弄清楚论文中描述的数学。有人可以帮我解决这个问题吗?任何帮助表示赞赏。
参考
Epipolar-Plane Image Analysis: An Approach to Determining Structure from Motion* !
答案 0 :(得分:0)
这种情况下的数学很简单直接。
首先让我们为具有焦距的相同相机拍摄的两个重叠图像定义两个坐标系,并采用以下模式:
让我们说第一个摄像机位置定义如下:
虽然使用三个欧拉角进行定向是:
通过使用此定义,相应的旋转矩阵是单位矩阵
第二个摄像机位置可以定义如下:
由于方向与第一台相机相同,因此所有欧拉角都保持为零:
这也意味着相应的旋转矩阵是单位矩阵。
如果图像重叠且方向相同,则图像空间中的情况如下所示:
此处图像坐标及其测量精度定义如下:
可以使用Intercept Theorem:
来描述这种几何情况
如你所见,并不复杂。但请注意,这种解决方案肯定不是最好的,因为所有方位角相同的基本假设在现实中都无法实现。
如果您需要准确,那么您必须执行捆绑调整。然而,这个方程通常用于确定这种几何情形的近似解,其中这些值用于线性化共线性方程。