在SoA安排中是否有任何标准的向量矩阵乘法方法?因此,据我了解,在SoA中,我可以使用3个向量(每个分量位于单独的数组中),对于基本操作,请使用3x3矩阵(旋转/比例)结合向量加法进行平移。相反的情况是AoS使用4x4矩阵和4矢量乘法进行整个变换(但是将一个分量浪费为0或1)。实现后者看起来很简单(将矩阵存储在4个SIMD寄存器中,加载下一个向量,执行工作(多路/加法),存储向量)。但是,我在如何与3x3矩阵进行乘法运算方面遇到了麻烦-看来我只需要9个SIMD寄存器用于矩阵-每个矩阵分量都调整为相同值的4个向量。但是,我只有8个寄存器,因此我将需要存储中间体(这将是更多的加载/存储指令)。那么,有什么聪明的方法吗?