在C中使用SSE:如何在寄存器中加载分布式值

时间:2014-11-26 21:10:58

标签: c++ c matrix sse

我需要使用SSE在C中实现nxn矩阵A * B = C的简单矩阵乘法。矩阵表示为一维浮点数组。 问题是_mm_load_ps()只接受一个指针作为参数,并从该地址加载四个浮点数。对于矩阵A,这是可以的,因为这些值彼此相邻。但是对于矩阵B,我需要给_mm_load_ps()四个指针来加载在我的向量表示中分布的值。我还想避免在临时数组中将向量中的四个值组合起来。 有没有一种简单的方法(如SSE功能)来做到这一点? 谢谢

0 个答案:

没有答案