如何使用SSE逻辑指令

时间:2012-05-28 19:19:19

标签: x86 sse simd

我需要一些关于如何在Visual Studio上使用SSE逻辑指令的帮助。基于MSDN website

__m128 _mm_and_ps(__m128 a , __m128 b );
ANDPS

可用于对操作数 a b 执行逻辑AND。但我无法弄清楚返回结果所需的确切步骤(内存加载和初始化,设置,存储等)。

具体来说,我想知道如何:

  1. 执行操作,
  2. 取回结果,
  3. 获得结果的大小(有效位数)。
  4. 有人可以在一个例子中告诉我如何做到这一点吗?

    谢谢!

1 个答案:

答案 0 :(得分:4)

这是一个例子 - 使用XOR反转浮点向量中所有元素的符号:

__m128 v1 = _mm_set_ps(0.0f, 1.0f, -1.0f, -2.0f);
                                       //   v1 =  0.0f,  1.0f, -1.0f, -2.0f
__m128 sign = _mm_set1_ps(-0.0f);      // sign = -0.0f, -0.0f, -0.0f, -0.0f
__m128 v2 = _mm_xor_ps(v1, sign);      //   v2 = -0.0f, -1.0f,  1.0f,  2.0f

所以,假设你想要否定数组中的所有值,你可以一次做4个元素,如下所示:

const int N = 1024;
float a[N];
const __m128 sign = _mm_set1_ps(-0.0f);// sign = -0.0f, -0.0f, -0.0f, -0.0f
for (int i = 0; i < N; i += 4)
{
    v = _mm_loadu_ps(&a[i]);           // load 4 elements (unaligned) from a[]
    v = _mm_xor_ps(v1, sign);          // invert sign bit (i.e. negate)
    _mm_storeu_ps(&a[i], v);           // store 4 elements (unaligned) back to a[]
}