题
我开始学习 3D 渲染,并且取得了很大的进步。我学到了很多关于矩阵和可以对其执行的一般操作的知识。
我还不太明白的一件事是 OpenGL 对矩阵的使用。我经常看到这样的事情(以及类似的事情):
x y z n
-------
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
所以我最好的理解是,它是一个归一化(无大小)4 维、列主矩阵。此外,该矩阵特别被称为“单位矩阵”。
一些问题:
- “第 n”维是什么?
- 如何以及何时应用这些?
我最大的困惑来自于 OpenGL 如何使用此类数据。
解决方案
可能有助于您入门的简短答案是,您所说的“第 n”维并不代表任何可可视化的数量。它被添加为一个实用工具,可以实现引起平移和透视投影的矩阵乘法。直观的 3x3 矩阵无法做到这些事情。
表示空间中的点的 3d 值总是附加 1 作为第四个值,以使此技巧发挥作用。表示方向的 3d 值(即法线(如果您熟悉该术语)会在第四个位置附加 0。
其他提示
在大多数 3D 图形中,点由 4 分量向量 (x, y, z, w) 表示,其中 w = 1。应用于点的常见操作包括平移、缩放、旋转、反射、倾斜以及这些操作的组合。
这些变换可以用称为“矩阵”的数学对象来表示。矩阵应用于向量,如下所示:
[ a b c tx ] [ x ] [ a*x + b*y + c*z + tx*w ]
| d e f ty | | y | = | d*x + e*y + f*z + ty*w |
| g h i tz | | z | | g*x + h*y + i*z + tz*w |
[ p q r s ] [ w ] [ p*x + q*y + r*z + s*w ]
例如,缩放表示为
[ 2 . . . ] [ x ] [ 2x ]
| . 2 . . | | y | = | 2y |
| . . 2 . | | z | | 2z |
[ . . . 1 ] [ 1 ] [ 1 ]
和翻译为
[ 1 . . dx ] [ x ] [ x + dx ]
| . 1 . dy | | y | = | y + dy |
| . . 1 dz | | z | | z + dz |
[ . . . 1 ] [ 1 ] [ 1 ]
第四个组件的原因之一是使平移可由矩阵表示。
使用矩阵的优点是可以通过矩阵乘法将多个变换合并为一个变换。
现在,如果目的只是将翻译放在桌面上,那么我会说 (x, y, z, 1) 而不是 (x, y, z, w) 并使矩阵的最后一行始终 [0 0 0 1]
, ,就像通常对 2D 图形所做的那样。事实上,4 分量向量将通过以下公式映射回正常的 3 向量:
[ x(3D) ] [ x / w ]
| y(3D) ] = | y / w |
[ z(3D) ] [ z / w ]
这就是所谓的 齐次坐标. 允许这一点使得透视投影也可以用矩阵表示, 它可以再次与所有其他转换相结合。
例如,由于距离较远的物体在屏幕上应该较小,因此我们使用公式将 3D 坐标转换为 2D
x(2D) = x(3D) / (10 * z(3D))
y(2D) = y(3D) / (10 * z(3D))
现在如果我们应用投影矩阵
[ 1 . . . ] [ x ] [ x ]
| . 1 . . | | y | = | y |
| . . 1 . | | z | | z |
[ . . 10 . ] [ 1 ] [ 10*z ]
那么真实的 3D 坐标将变成
x(3D) := x/w = x/10z
y(3D) := y/w = y/10z
z(3D) := z/w = 0.1
所以我们只需要切掉 z 坐标即可投影到 2D。