Question

我开始学习3D渲染，并且我一直在取得良好进展。我已经了解了很多关于矩阵和可以在它们上执行的一般操作。

我还没有完全关注的一件事是OpenGL使用矩阵。我看到这个（以及类似的东西）相当多：

x y z n
-------
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1

所以我最好的理解是它是一个标准化（无量级）的4维列主矩阵。此外，该矩阵特别称为“单位矩阵”。

有些问题：

什么是“第n”维度？
这些如何以及何时适用？

我最大的困惑来自于OpenGL如何利用这种数据。

Answer 1

在大多数3D图形中，点由4分量矢量（x，y，z，w）表示，其中w = 1.应用于点的常用操作包括平移，缩放，旋转，反射，倾斜和组合这些。

这些变换可以用称为“矩阵”的数学对象来表示。矩阵适用于这样的矢量：

[ a b c tx ] [ x ]   [ a*x + b*y + c*z + tx*w ]
| d e f ty | | y | = | d*x + e*y + f*z + ty*w |
| g h i tz | | z |   | g*x + h*y + i*z + tz*w |
[ p q r s  ] [ w ]   [ p*x + q*y + r*z +  s*w ]

例如，缩放表示为

[ 2 . . . ] [ x ]   [ 2x ]
| . 2 . . | | y | = | 2y |
| . . 2 . | | z |   | 2z |
[ . . . 1 ] [ 1 ]   [ 1  ]

和翻译为

[ 1 . . dx ] [ x ]   [ x + dx ]
| . 1 . dy | | y | = | y + dy |
| . . 1 dz | | z |   | z + dz |
[ . . . 1  ] [ 1 ]   [   1    ]

第四个组成部分的原因之一是使矩阵可以表示翻译。

使用矩阵的优点是可以通过矩阵乘法将多个变换组合成一个变换。

现在，如果目的仅仅是为了在表上进行翻译，那么我会说（x，y，z，1）而不是（x，y，z，w）并且使矩阵的最后一行总是[0 0 0 1]，通常用于2D图形。实际上，通过以下公式将4分量矢量映射回正常的3矢量矢量：

[ x(3D) ]   [ x / w ]
| y(3D) ] = | y / w |
[ z(3D) ]   [ z / w ]

这称为homogeneous coordinates。 允许这样做也可以用矩阵表示透视投影， ，它可以再次与所有其他变换结合使用。

例如，由于屏幕上较远的物体应该较小，我们使用公式将3D坐标转换为2D

x(2D) = x(3D) / (10 * z(3D))
y(2D) = y(3D) / (10 * z(3D))

现在，如果我们应用投影矩阵

[ 1 . .  . ] [ x ]   [  x   ]
| . 1 .  . | | y | = |  y   |
| . . 1  . | | z |   |  z   |
[ . . 10 . ] [ 1 ]   [ 10*z ]

然后真正的3D坐标将成为

x(3D) := x/w = x/10z
y(3D) := y/w = y/10z
z(3D) := z/w = 0.1

所以我们只需要将z坐标切出来投影到2D。

Answer 2

可能有助于您入门的简短答案是，您所谓的“第n”维度并不代表任何可视化数量。它被添加为实用工具，以实现导致平移和透视投影的矩阵乘法。直观的3x3矩阵无法做到这些。

表示空间中的点的3d值总是会附加1作为第四个值以使此技巧起作用。表示方向的3d值（即正常，如果您熟悉该术语）在第四个点附加0。

了解OpenGL矩阵

2 个答案: