应用错误收集

我不完全确定你目前在做什么。但这样做的理智方式是不要接触VBO 。相反，将一个或多个转换矩阵作为制服传递到顶点着色器，并在GPU上执行矩阵乘法。

更改CPU上的VBO数据是疯狂的，这意味着要么在CPU上保留顶点数据的副本，迭代它并上传或映射缓冲区并迭代它。无论哪种方式，它都会非常缓慢。拥有VBO的全部意义在于，您可以上传顶点数据一次，并在CPU上同时工作，同时GPU消除错误并对所述顶点数据进行处理。

相反，您只需将顶点存储在顶点缓冲区中一次，最好是在对象空间中（仅为了理智）。然后，您可以跟踪每个对象的变换矩阵，该矩阵将顶点从对象的空间转换为剪辑空间。您将该矩阵传递给顶点着色器，并对GPU上的每个顶点进行乘法运算。

显然，GPU将每个顶点乘以每帧至少一个矩阵。但是GPU具有并行硬件，可以快速地进行矩阵乘法。因此，特别是当您的矩阵不断变化时（例如您的对象移动），这比在CPU上执行并更新大量缓冲区要快得多。此外，您可以释放CPU来执行物理或音频等任何其他操作。

现在我可以想象，如果你的对象永远不会移动，你会不想这样做，但是，GPU矩阵乘法可能与CPU浮点乘法的速度大致相同（我不知道具体细节）。因此，为静态对象设置更多着色器是否值得，这是值得怀疑的。

要点：

希望这有点帮助。