我有两个经过校准的相机,可以看到重叠的场景。我试图估计camera2相对于camera1的姿势(因为camera2可以移动;但是camera1和2都会有一些重叠的功能)。
我正在使用SIFT识别特征,计算基本矩阵并最终计算基本矩阵。一旦我解决了R和t(四种可能的解决方案之一),我就可以按比例获得翻译,但有可能以某种方式计算现实世界单位的翻译吗?场景中没有已知大小的物体;但我确实有两台摄像机的校准数据。我已经了解了一些关于运动结构和立体姿态估计的信息,但是尺度的概念和与现实世界翻译的相关性令我感到困惑。
谢谢!
答案 0 :(得分:2)
这是运动结构的经典尺度问题。
简短的回答是,您必须拥有其他一些信息来源才能解决规模问题。
此信息可以是场景中的点(例如地形图),或者是从移动摄像机(IMU,GPS等)读取的某些传感器