微软声称Kinect的视角为垂直43度,水平57度(陈述here)。鉴于这些,我们可以计算内在参数,即焦点和投影中心吗?我假设投影中心可以给出为(0,0,0)?
由于
编辑:有关我正在尝试做的更多信息
我有一个用Kinect记录的图像数据集,我试图将像素位置(x_screen,y_screen和z_world(mm))转换为真实世界坐标。
如果我知道相机位于真实世界坐标系中的点(x',y',z'),通过执行以下操作就足以找到真实世界坐标:
x_world = (x_screen - c_x) * z_world / f_x
y_world = (y_screen - c_y) * z_world / f_y
其中c_x = x'
和c_y = y'
以及f_x, f_y
是焦距?另外,只要了解视野,我怎样才能找到焦距?
由于
答案 0 :(得分:19)
如果您将世界原点(0,0,0)与相机焦点(调用投影中心)等同于和,则假设相机指向正z轴,然后情况在x = 0:
的平面上看起来像这样
这里的轴是z(水平)和y(垂直)。下标v
用于“视口”或屏幕,w
用于世界。
如果我的意思正确,您知道h
,屏幕高度(以像素为单位)。此外,zw
,yv
和xv
。您想知道yw
和xw
。请注意,此计算在视口的中心有(0,0)。使用左上角的(0,0)适当调整通常的屏幕坐标系。应用一点trig:
tan(43/2) = (h/2) / f = h / (2f), so f = h / ( 2 tan(43/2) )
和类似的三角形
yw / zw = yv / f also xw / zw = xv / f
解:
yw = zw * yv / f and xw = zw * xv / f
请注意,这假设摄像机的“焦距”在x方向上相等。它不一定是。为了在xw
中获得最佳准确度,您应该使用f = w / 2 tan(57/2)
重新计算,其中w
是屏幕宽度。这是因为f
不是真正的焦距。这只是转换的常数。如果相机的像素是方形且光学器件没有像差,则这两个f
计算将得到相同的结果。
NB:在一篇已删除(不正当)的文章中,OP似乎表示它不是zw,而是斜边的长度D:origin to(xw,yw,zw)。在这种情况下,请注意zw = D * f / sqrt(xv² + yv² + f²)
(假设相机像素是正方形;否则需要进行一些缩放)。你可以按照上面的步骤进行操作。
答案 1 :(得分:0)
我无法添加评论,因为我的声誉太低了。 但我提醒一下,kinect的摄像机角度一般都不一样 像普通照相机一样,由于视频流格式及其传感器芯片。因此,提到57度和43度的SDK可能指的是高度和宽度的不同度分辨率。
它发送一个320x240像素的位图,这些像素与
相关Horizontal FOV: 58,5° (as distributed over 320 pixels horizontal)
Vertical FOV: 45,6° (as distributed over 240 pixels vertical).
Z已知您的角度是已知的,所以我使用正弦定律可以得到正确的位置然后https://en.wikipedia.org/wiki/Law_of_sines