了解 OpenGL 矩阵

https://stackoverflow.com/questions/2465116

20-09-2019
|

题

我开始学习 3D 渲染，并且取得了很大的进步。我学到了很多关于矩阵和可以对其执行的一般操作的知识。

我还不太明白的一件事是 OpenGL 对矩阵的使用。我经常看到这样的事情（以及类似的事情）：

x y z n
-------
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1

所以我最好的理解是，它是一个归一化（无大小）4 维、列主矩阵。此外，该矩阵特别被称为“单位矩阵”。

一些问题：

“第 n”维是什么？
如何以及何时应用这些？

我最大的困惑来自于 OpenGL 如何使用此类数据。

解决方案

可能有助于您入门的简短答案是，您所说的“第 n”维并不代表任何可可视化的数量。它被添加为一个实用工具，可以实现引起平移和透视投影的矩阵乘法。直观的 3x3 矩阵无法做到这些事情。

表示空间中的点的 3d 值总是附加 1 作为第四个值，以使此技巧发挥作用。表示方向的 3d 值（即法线（如果您熟悉该术语）会在第四个位置附加 0。

其他提示

在大多数 3D 图形中，点由 4 分量向量 (x, y, z, w) 表示，其中 w = 1。应用于点的常见操作包括平移、缩放、旋转、反射、倾斜以及这些操作的组合。

这些变换可以用称为“矩阵”的数学对象来表示。矩阵应用于向量，如下所示：

[ a b c tx ] [ x ]   [ a*x + b*y + c*z + tx*w ]
| d e f ty | | y | = | d*x + e*y + f*z + ty*w |
| g h i tz | | z |   | g*x + h*y + i*z + tz*w |
[ p q r s  ] [ w ]   [ p*x + q*y + r*z +  s*w ]

例如，缩放表示为

[ 2 . . . ] [ x ]   [ 2x ]
| . 2 . . | | y | = | 2y |
| . . 2 . | | z |   | 2z |
[ . . . 1 ] [ 1 ]   [ 1  ]

和翻译为

[ 1 . . dx ] [ x ]   [ x + dx ]
| . 1 . dy | | y | = | y + dy |
| . . 1 dz | | z |   | z + dz |
[ . . . 1  ] [ 1 ]   [   1    ]

第四个组件的原因之一是使平移可由矩阵表示。

使用矩阵的优点是可以通过矩阵乘法将多个变换合并为一个变换。

现在，如果目的只是将翻译放在桌面上，那么我会说 (x, y, z, 1) 而不是 (x, y, z, w) 并使矩阵的最后一行始终 [0 0 0 1], ，就像通常对 2D 图形所做的那样。事实上，4 分量向量将通过以下公式映射回正常的 3 向量：

[ x(3D) ]   [ x / w ]
| y(3D) ] = | y / w |
[ z(3D) ]   [ z / w ]

这就是所谓的齐次坐标. 允许这一点使得透视投影也可以用矩阵表示， 它可以再次与所有其他转换相结合。

例如，由于距离较远的物体在屏幕上应该较小，因此我们使用公式将 3D 坐标转换为 2D

x(2D) = x(3D) / (10 * z(3D))
y(2D) = y(3D) / (10 * z(3D))

现在如果我们应用投影矩阵

[ 1 . .  . ] [ x ]   [  x   ]
| . 1 .  . | | y | = |  y   |
| . . 1  . | | z |   |  z   |
[ . . 10 . ] [ 1 ]   [ 10*z ]

那么真实的 3D 坐标将变成

x(3D) := x/w = x/10z
y(3D) := y/w = y/10z
z(3D) := z/w = 0.1

所以我们只需要切掉 z 坐标即可投影到 2D。

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow