我需要一些关于如何在Visual Studio上使用SSE逻辑指令的帮助。基于MSDN website,
__m128 _mm_and_ps(__m128 a , __m128 b );
ANDPS
可用于对操作数 a 和 b 执行逻辑AND。但我无法弄清楚返回结果所需的确切步骤(内存加载和初始化,设置,存储等)。
具体来说,我想知道如何:
有人可以在一个例子中告诉我如何做到这一点吗?
谢谢!
答案 0 :(得分:4)
这是一个例子 - 使用XOR反转浮点向量中所有元素的符号:
__m128 v1 = _mm_set_ps(0.0f, 1.0f, -1.0f, -2.0f);
// v1 = 0.0f, 1.0f, -1.0f, -2.0f
__m128 sign = _mm_set1_ps(-0.0f); // sign = -0.0f, -0.0f, -0.0f, -0.0f
__m128 v2 = _mm_xor_ps(v1, sign); // v2 = -0.0f, -1.0f, 1.0f, 2.0f
所以,假设你想要否定数组中的所有值,你可以一次做4个元素,如下所示:
const int N = 1024;
float a[N];
const __m128 sign = _mm_set1_ps(-0.0f);// sign = -0.0f, -0.0f, -0.0f, -0.0f
for (int i = 0; i < N; i += 4)
{
v = _mm_loadu_ps(&a[i]); // load 4 elements (unaligned) from a[]
v = _mm_xor_ps(v1, sign); // invert sign bit (i.e. negate)
_mm_storeu_ps(&a[i], v); // store 4 elements (unaligned) back to a[]
}