标签: simd intrinsics avx
使用SSE,你可以将一个浮点数从内存加载到__m128的所有4个插槽中,内置_mm_load1_ps()
当使用带有AVX的256位宽SIMD时,似乎没有_mm256_load1_ps()将单个浮点数从内存加载到向量的所有8个插槽中。
为什么会出现这种遗漏,以及最好的解决方法是什么?
甚至更好:有没有办法将单个浮点数加载到向量的目标插槽0..7?
答案 0 :(得分:11)
_mm256_broadcast_ss正是您要找的。 p>