我开始学习3D渲染,并且我一直在取得良好进展。我已经了解了很多关于矩阵和可以在它们上执行的一般操作。
我还没有完全关注的一件事是OpenGL使用矩阵。我看到这个(以及类似的东西)相当多:
x y z n
-------
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
所以我最好的理解是它是一个标准化(无量级)的4维列主矩阵。此外,该矩阵特别称为“单位矩阵”。
有些问题:
我最大的困惑来自于OpenGL如何利用这种数据。
答案 0 :(得分:60)
在大多数3D图形中,点由4分量矢量(x,y,z,w)表示,其中w = 1.应用于点的常用操作包括平移,缩放,旋转,反射,倾斜和组合这些。
这些变换可以用称为“矩阵”的数学对象来表示。矩阵适用于这样的矢量:
[ a b c tx ] [ x ] [ a*x + b*y + c*z + tx*w ]
| d e f ty | | y | = | d*x + e*y + f*z + ty*w |
| g h i tz | | z | | g*x + h*y + i*z + tz*w |
[ p q r s ] [ w ] [ p*x + q*y + r*z + s*w ]
例如,缩放表示为
[ 2 . . . ] [ x ] [ 2x ]
| . 2 . . | | y | = | 2y |
| . . 2 . | | z | | 2z |
[ . . . 1 ] [ 1 ] [ 1 ]
和翻译为
[ 1 . . dx ] [ x ] [ x + dx ]
| . 1 . dy | | y | = | y + dy |
| . . 1 dz | | z | | z + dz |
[ . . . 1 ] [ 1 ] [ 1 ]
第四个组成部分的原因之一是使矩阵可以表示翻译。
使用矩阵的优点是可以通过矩阵乘法将多个变换组合成一个变换。
现在,如果目的仅仅是为了在表上进行翻译,那么我会说(x,y,z,1)而不是(x,y,z,w)并且使矩阵的最后一行总是[0 0 0 1]
,通常用于2D图形。实际上,通过以下公式将4分量矢量映射回正常的3矢量矢量:
[ x(3D) ] [ x / w ]
| y(3D) ] = | y / w |
[ z(3D) ] [ z / w ]
这称为homogeneous coordinates。 允许这样做也可以用矩阵表示透视投影, ,它可以再次与所有其他变换结合使用。
例如,由于屏幕上较远的物体应该较小,我们使用公式将3D坐标转换为2D
x(2D) = x(3D) / (10 * z(3D))
y(2D) = y(3D) / (10 * z(3D))
现在,如果我们应用投影矩阵
[ 1 . . . ] [ x ] [ x ]
| . 1 . . | | y | = | y |
| . . 1 . | | z | | z |
[ . . 10 . ] [ 1 ] [ 10*z ]
然后真正的3D坐标将成为
x(3D) := x/w = x/10z
y(3D) := y/w = y/10z
z(3D) := z/w = 0.1
所以我们只需要将z坐标切出来投影到2D。
答案 1 :(得分:3)
可能有助于您入门的简短答案是,您所谓的“第n”维度并不代表任何可视化数量。它被添加为实用工具,以实现导致平移和透视投影的矩阵乘法。直观的3x3矩阵无法做到这些。
表示空间中的点的3d值总是会附加1作为第四个值以使此技巧起作用。表示方向的3d值(即正常,如果您熟悉该术语)在第四个点附加0。