应用错误收集

AVX 256位等效于_mm_load1_ps

时间：2013-06-13 23:59:06

标签： simd intrinsics avx

使用SSE，你可以将一个浮点数从内存加载到__m128的所有4个插槽中，内置_mm_load1_ps（）

当使用带有AVX的256位宽SIMD时，似乎没有_mm256_load1_ps（）将单个浮点数从内存加载到向量的所有8个插槽中。

为什么会出现这种遗漏，以及最好的解决方法是什么？

甚至更好：有没有办法将单个浮点数加载到向量的目标插槽0..7？

1 个答案:

答案 0 :(得分：11)

_mm256_broadcast_ss正是您要找的。