我正在使用OpenCV从一系列棋盘图像估计网络摄像头的内在矩阵 - 详见本tutorial,并反向投影像素到方向(以方位角/仰角角度)。
最终目标是让用户选择图像上的一个点,估计此点相对于网络摄像头中心的方向,并将其用作波束成形算法的DOA。
因此,一旦我估算了内在矩阵,我就反向投影用户选择的像素(参见下面的代码)并将其显示为方位角/仰角。
result = [0, 0, 0] # reverse projected point, in homogeneous coord.
while 1:
_, img = cap.read()
if flag: # If the user has clicked somewhere
result = np.dot(np.linalg.inv(mtx), [mouse_x, mouse_y, 1])
result = np.arctan(result) # convert to angle
flag = False
cv2.putText(img, '({},{})'.format(mouse_x, mouse_y), (20, 440), cv2.FONT_HERSHEY_SIMPLEX,
0.5, (0, 255, 0), 2, cv2.LINE_AA)
cv2.putText(img, '({:.2f},{:.2f})'.format(180/np.pi*result[0], 180/np.pi*result[1]), (20, 460),
cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2, cv2.LINE_AA)
cv2.imshow('image', img)
if cv2.waitKey(1) & 0xFF == ord('q'):
break
我的问题是我不确定我的结果是否一致。主要的不连贯性是,对应于{0,0}角度的图像的点明显偏离图像中心,如下所示(出于隐私原因,相机图像已被黑色背景替换):
我真的没有看到一种简单而有效的测量精度的方法(我能想到的唯一方法就是使用带有激光的伺服电机,就在相机下面并将其指向计算方向)
这是使用15张图像校准后的内在矩阵:
我得到的错误大概是 0.44 RMS ,这似乎令人满意。
我的校准代码:
nCalFrames = 12 # number of frames for calibration
nFrames = 0
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 30, 0.001) # termination criteria
objp = np.zeros((9*7, 3), np.float32)
objp[:, :2] = np.mgrid[0:9, 0:7].T.reshape(-1, 2)
objpoints = [] # 3d point in real world space
imgpoints = [] # 2d points in image plane.
cap = cv2.VideoCapture(0)
previousTime = 0
gray = 0
while 1:
# Capture frame-by-frame
_, img = cap.read()
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# Find the chess board corners
ret, corners = cv2.findChessboardCorners(gray, (9, 7), None)
# If found, add object points, image points (after refining them)
if ret:
corners2 = cv2.cornerSubPix(gray, corners, (11, 11), (-1, -1), criteria)
if time.time() - previousTime > 2:
previousTime = time.time()
imgpoints.append(corners2)
objpoints.append(objp)
img = cv2.bitwise_not(img)
nFrames = nFrames + 1
# Draw and display the corners
img = cv2.drawChessboardCorners(img, (9, 7), corners, ret)
cv2.putText(img, '{}/{}'.format(nFrames, nCalFrames), (20, 460), cv2.FONT_HERSHEY_SIMPLEX,
2, (0, 255, 0), 2, cv2.LINE_AA)
cv2.putText(img, 'press \'q\' to exit...', (255, 15), cv2.FONT_HERSHEY_SIMPLEX,
0.5, (0, 0, 255), 1, cv2.LINE_AA)
# Display the resulting frame
cv2.imshow('Webcam Calibration', img)
if nFrames == nCalFrames:
break
if cv2.waitKey(1) & 0xFF == ord('q'):
break
RMS_error, mtx, disto_coef, _, _ = cv2.calibrateCamera(objpoints, imgpoints, gray.shape[::-1], None, None)
编辑:另一种测试方法是使用具有已知角度点的白板,并通过与实验结果进行比较来估算误差,但我不知道如何设置这样的系统
答案 0 :(得分:2)
关于您的第一个问题,将主要点放在图像中心是正常的。估计点,即零仰角和方位角的点,是使径向失真系数最小化的点,对于低值广角镜头(例如,典型的网络摄像头的镜头),它可以容易地以显着量关闭。
您的校准应该可以通话calibrateCamera
。但是,在您的代码段中,您似乎忽略了失真系数。缺少的是initUndistortRectifyMap
,如果重要的话,它还可以使主要点重新定位。
h, w = img.shape[:2]
# compute new camera matrix with central principal point
new_mtx,roi = cv2.getOptimalNewCameraMatrix(mtx,disto_coef,(w,h),1,(w,h))
print(new_mtx)
# compute undistort maps
mapx,mapy = cv2.initUndistortRectifyMap(mtx,disto_coef,None,new_mtx,(w,h),5)
它基本上使焦距在两个维度上都相等,并且以焦点为中心(参见参数的OpenCV python文档)。
然后,每个
_, img = cap.read()
你必须在渲染之前取消图像
# apply the remap
img = cv2.remap(img,mapx,mapy,cv2.INTER_LINEAR)
# crop the image
x,y,w,h = roi
img = img[y:y+h, x:x+w]
在这里,我将背景设置为绿色以强调桶形失真。输出可能是这样的(由于隐私原因,相机图像被棋盘替换):
如果您执行所有这些操作,您的校准目标是准确的,并且您的校准样本会填满整个图像区域,您应该对计算非常有信心。然而,为了验证相对于未失真图像的像素读数的测量方位角和仰角,我可能会建议从镜头第一主点测量卷尺,并将校准板放在相机前面的正常角度。在那里你可以计算出预期的角度并进行比较。
希望这有帮助。