Question

我正在使用OpenCV从一系列棋盘图像估计网络摄像头的内在矩阵 - 详见本tutorial，并反向投影像素到方向（以方位角/仰角角度）。

最终目标是让用户选择图像上的一个点，估计此点相对于网络摄像头中心的方向，并将其用作波束成形算法的DOA。

因此，一旦我估算了内在矩阵，我就反向投影用户选择的像素（参见下面的代码）并将其显示为方位角/仰角。

result = [0, 0, 0]  # reverse projected point, in homogeneous coord.
while 1:
    _, img = cap.read()
    if flag:  # If the user has clicked somewhere
        result = np.dot(np.linalg.inv(mtx), [mouse_x, mouse_y, 1])
        result = np.arctan(result)  # convert to angle
        flag = False

    cv2.putText(img, '({},{})'.format(mouse_x, mouse_y), (20, 440), cv2.FONT_HERSHEY_SIMPLEX,
                0.5, (0, 255, 0), 2, cv2.LINE_AA)
    cv2.putText(img, '({:.2f},{:.2f})'.format(180/np.pi*result[0], 180/np.pi*result[1]), (20, 460),
                cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2, cv2.LINE_AA)

    cv2.imshow('image', img)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

我的问题是我不确定我的结果是否一致。主要的不连贯性是，对应于{0,0}角度的图像的点明显偏离图像中心，如下所示（出于隐私原因，相机图像已被黑色背景替换）：

我真的没有看到一种简单而有效的测量精度的方法（我能想到的唯一方法就是使用带有激光的伺服电机，就在相机下面并将其指向计算方向）

这是使用15张图像校准后的内在矩阵：

我得到的错误大概是 0.44 RMS ，这似乎令人满意。

我的校准代码：

nCalFrames = 12  # number of frames for calibration
nFrames = 0
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 30, 0.001)  # termination criteria

objp = np.zeros((9*7, 3), np.float32)
objp[:, :2] = np.mgrid[0:9, 0:7].T.reshape(-1, 2)
objpoints = []  # 3d point in real world space
imgpoints = []  # 2d points in image plane.

cap = cv2.VideoCapture(0)
previousTime = 0
gray = 0

while 1:
    # Capture frame-by-frame
    _, img = cap.read()

    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    # Find the chess board corners
    ret, corners = cv2.findChessboardCorners(gray, (9, 7), None)

    # If found, add object points, image points (after refining them)
    if ret:

        corners2 = cv2.cornerSubPix(gray, corners, (11, 11), (-1, -1), criteria)

        if time.time() - previousTime > 2:
            previousTime = time.time()
            imgpoints.append(corners2)
            objpoints.append(objp)
            img = cv2.bitwise_not(img)
            nFrames = nFrames + 1

        # Draw and display the corners
        img = cv2.drawChessboardCorners(img, (9, 7), corners, ret)

    cv2.putText(img, '{}/{}'.format(nFrames, nCalFrames), (20, 460), cv2.FONT_HERSHEY_SIMPLEX,
                2, (0, 255, 0), 2, cv2.LINE_AA)
    cv2.putText(img, 'press \'q\' to exit...', (255, 15), cv2.FONT_HERSHEY_SIMPLEX,
                0.5, (0, 0, 255), 1, cv2.LINE_AA)
    # Display the resulting frame
    cv2.imshow('Webcam Calibration', img)
    if nFrames == nCalFrames:
        break

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

RMS_error, mtx, disto_coef, _, _ = cv2.calibrateCamera(objpoints, imgpoints, gray.shape[::-1], None, None)

编辑：另一种测试方法是使用具有已知角度点的白板，并通过与实验结果进行比较来估算误差，但我不知道如何设置这样的系统

Answer 1

关于您的第一个问题，将主要点放在图像中心是正常的。估计点，即零仰角和方位角的点，是使径向失真系数最小化的点，对于低值广角镜头（例如，典型的网络摄像头的镜头），它可以容易地以显着量关闭。

您的校准应该可以通话calibrateCamera。但是，在您的代码段中，您似乎忽略了失真系数。缺少的是initUndistortRectifyMap，如果重要的话，它还可以使主要点重新定位。

h,  w = img.shape[:2]
# compute new camera matrix with central principal point
new_mtx,roi = cv2.getOptimalNewCameraMatrix(mtx,disto_coef,(w,h),1,(w,h))
print(new_mtx)
# compute undistort maps
mapx,mapy = cv2.initUndistortRectifyMap(mtx,disto_coef,None,new_mtx,(w,h),5)

它基本上使焦距在两个维度上都相等，并且以焦点为中心（参见参数的OpenCV python文档）。

然后，每个

_, img = cap.read()

你必须在渲染之前取消图像

# apply the remap
img = cv2.remap(img,mapx,mapy,cv2.INTER_LINEAR)
# crop the image
x,y,w,h = roi
img = img[y:y+h, x:x+w]

在这里，我将背景设置为绿色以强调桶形失真。输出可能是这样的（由于隐私原因，相机图像被棋盘替换）：

如果您执行所有这些操作，您的校准目标是准确的，并且您的校准样本会填满整个图像区域，您应该对计算非常有信心。然而，为了验证相对于未失真图像的像素读数的测量方位角和仰角，我可能会建议从镜头第一主点测量卷尺，并将校准板放在相机前面的正常角度。在那里你可以计算出预期的角度并进行比较。

希望这有帮助。

摄像机校准，像素到方向的反向投影

1 个答案: