了解OpenGL矩阵

时间:2010-03-17 19:09:41

标签: opengl 3d-rendering

我开始学习3D渲染,并且我一直在取得良好进展。我已经了解了很多关于矩阵和可以在它们上执行的一般操作。

我还没有完全关注的一件事是OpenGL使用矩阵。我看到这个(以及类似的东西)相当多:

x y z n
-------
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1

所以我最好的理解是它是一个标准化(无量级)的4维列主矩阵。此外,该矩阵特别称为“单位矩阵”。

有些问题:

  • 什么是“第n”维度?
  • 这些如何以及何时适用?

我最大的困惑来自于OpenGL如何利用这种数据。

2 个答案:

答案 0 :(得分:60)

在大多数3D图形中,点由4分量矢量(x,y,z,w)表示,其中w = 1.应用于点的常用操作包括平移,缩放,旋转,反射,倾斜和组合这些。

这些变换可以用称为“矩阵”的数学对象来表示。矩阵适用于这样的矢量:

[ a b c tx ] [ x ]   [ a*x + b*y + c*z + tx*w ]
| d e f ty | | y | = | d*x + e*y + f*z + ty*w |
| g h i tz | | z |   | g*x + h*y + i*z + tz*w |
[ p q r s  ] [ w ]   [ p*x + q*y + r*z +  s*w ]

例如,缩放表示为

[ 2 . . . ] [ x ]   [ 2x ]
| . 2 . . | | y | = | 2y |
| . . 2 . | | z |   | 2z |
[ . . . 1 ] [ 1 ]   [ 1  ]

和翻译为

[ 1 . . dx ] [ x ]   [ x + dx ]
| . 1 . dy | | y | = | y + dy |
| . . 1 dz | | z |   | z + dz |
[ . . . 1  ] [ 1 ]   [   1    ]

第四个组成部分的原因之一是使矩阵可以表示翻译。

使用矩阵的优点是可以通过矩阵乘法将多个变换组合成一个变换。

现在,如果目的仅仅是为了在表上进行翻译,那么我会说(x,y,z,1)而不是(x,y,z,w)并且使矩阵的最后一行总是[0 0 0 1],通常用于2D图形。实际上,通过以下公式将4分量矢量映射回正常的3矢量矢量:

[ x(3D) ]   [ x / w ]
| y(3D) ] = | y / w |
[ z(3D) ]   [ z / w ]

这称为homogeneous coordinates 允许这样做也可以用矩阵表示透视投影, ,它可以再次与所有其他变换结合使用。

例如,由于屏幕上较远的物体应该较小,我们使用公式将3D坐标转换为2D

x(2D) = x(3D) / (10 * z(3D))
y(2D) = y(3D) / (10 * z(3D))

现在,如果我们应用投影矩阵

[ 1 . .  . ] [ x ]   [  x   ]
| . 1 .  . | | y | = |  y   |
| . . 1  . | | z |   |  z   |
[ . . 10 . ] [ 1 ]   [ 10*z ]

然后真正的3D坐标将成为

x(3D) := x/w = x/10z
y(3D) := y/w = y/10z
z(3D) := z/w = 0.1

所以我们只需要将z坐标切出来投影到2D。

答案 1 :(得分:3)

可能有助于您入门的简短答案是,您所谓的“第n”维度并不代表任何可视化数量。它被添加为实用工具,以实现导致平移和透视投影的矩阵乘法。直观的3x3矩阵无法做到这些。

表示空间中的点的3d值总是会附加1作为第四个值以使此技巧起作用。表示方向的3d值(即正常,如果您熟悉该术语)在第四个点附加0。