OpenCV:从翻译中获取透视矩阵&回转

时间:2014-04-24 17:32:17

标签: opencv camera-calibration

我正在尝试验证我的相机校准,所以我想纠正校准图像。我希望这将涉及使用warpPerspective的调用,但我没有看到一个明显的函数,它采用相机矩阵,旋转和平移向量为此调用生成透视矩阵。

基本上我想做here描述的过程(尤其是最后的图像),但从已知的相机模型和姿势开始。

是否有一个简单的函数调用,它接受相机的内在和外在参数,并计算透视矩阵以便在warpPerspective中使用?

在图片上调用warpPerspective后,我会打电话给undistort

原则上,我可以通过在指定约束Z=0后求解opencv camera calibration documentation顶部定义的方程组来推导出解决方案,但我认为必须有一个固定的例行程序允许我对我的测试图像进​​行正射校正。

在我的搜索中,我发现很难通过所有的立体声校准结果 - 我只有一台摄像机,但是想要在我只看平面测试模式的约束下纠正图像。

2 个答案:

答案 0 :(得分:14)

实际上没有必要涉及正交相机。以下是如何获得适当的透视变换。

如果您使用cv::calibrateCamera校准了相机,则为相机获取了相机矩阵K一个镜头失真系数D矢量,并且对于您使用的每个图像,都是一个旋转向量rvec(您可以使用Rdoc)和翻译向量cv::rodrigues将其转换为3x3矩阵T。考虑其中一个图片以及相关的RT。使用失真系数调用cv::undistort后,图像就像投影矩阵K * [ R | T ]的摄像头一样。

基本上(如@DavidNilosek直觉),你想要取消旋转并获得图像,好像它是由K * [ I | -C ]形式的投影矩阵获取的,其中C=-R.inv()*T是摄像机位置。为此,您必须应用以下转换:

Hr = K * R.inv() * K.inv()

唯一可能的问题是扭曲的图像可能会超出图像平面的可见部分。因此,您可以使用其他翻译来解决该问题,如下所示:

     [ 1  0  |         ]
Ht = [ 0  1  | -K*C/Cz ]
     [ 0  0  |         ]

其中Cz是沿Oz轴的C分量。

最后,根据上面的定义,H = Ht * Hr是对所考虑图像的整形透视变换。

答案 1 :(得分:1)

这是我的意思草图"解决方程系统" (在Python中):

import cv2
import scipy  # I use scipy by habit; numpy would be fine too
#rvec= the rotation vector
#tvec = the translation *emphasized text*matrix
#A = the camera intrinsic

def unit_vector(v):
    return v/scipy.sqrt(scipy.sum(v*v))

(fx,fy)=(A[0,0], A[1,1])
Ainv=scipy.array( [ [1.0/fx, 0.0, -A[0,2]/fx],
                     [ 0.0,  1.0/fy, -A[1,2]/fy],
                     [ 0.0,    0.0,     1.0] ], dtype=scipy.float32 )
R=cv2.Rodrigues( rvec )
Rinv=scipy.transpose( R )

u=scipy.dot( Rinv, tvec ) # displacement between camera and world coordinate origin, in world coordinates


# corners of the image, for here hard coded
pixel_corners=[ scipy.array( c, dtype=scipy.float32 ) for c in [ (0+0.5,0+0.5,1), (0+0.5,640-0.5,1), (480-0.5,640-0.5,1), (480-0.5,0+0.5,1)] ]
scene_corners=[]
for c in pixel_corners:
    lhat=scipy.dot( Rinv, scipy.dot( Ainv, c) ) #direction of the ray that the corner images, in world coordinates
    s=u[2]/lhat[2]
    # now we have the case that (s*lhat-u)[2]==0,
    # i.e. s is how far along the line of sight that we need
    # to move to get to the Z==0 plane.
    g=s*lhat-u
    scene_corners.append( (g[0], g[1]) )

# now we have: 4 pixel_corners (image coordinates), and 4 corresponding scene_coordinates
# can call cv2.getPerspectiveTransform on them and so on..