C ++ SIMD:按位和运算后存储uint64_t值

时间:2017-02-26 00:20:36

标签: c++ c++11 sse simd

我试图在两个&整数数组的元素之间执行按位uint64_t,然后将结果存储在另一个数组中。这是我的计划:

#include <emmintrin.h>
#include <nmmintrin.h>
#include <chrono>


int main()
{

  uint64_t data[200];
  uint64_t data2[200];
  uint64_t data3[200];
  __m128i* ptr = (__m128i*) data;
  __m128i* ptr2 = (__m128i*) data2;
  uint64_t* ptr3 = data3;

  for (int i = 0; i < 100; ++i, ++ptr, ++ptr2, ptr3 += 2)
    _mm_store_ps(ptr3, _mm_and_si128(*ptr, *ptr2));

}

然而,我收到此错误:

test.cpp:17:50: error: cannot convert ‘uint64_t* {aka long unsigned int*}’ to ‘float*’ for argument ‘1’ to ‘void _mm_store_ps(float*, __m128)’
     _mm_store_ps(ptr3, _mm_and_si128(*ptr, *ptr2));

由于某种原因,编译器认为我正在复制到一个浮点数组。是否有可能对uint64_t

的数组做我想做的事情

2 个答案:

答案 0 :(得分:3)

您可以使用_mm_store_si128

首先将指针ptr3更改为

  __m128i* ptr3 = (__m128i*) data3;

然后

  for (int i = 0; i < 100; ++i, ++ptr, ++ptr2, ++ptr3)
    _mm_store_si128(ptr3, _mm_and_si128(*ptr, *ptr2));

答案 1 :(得分:1)

您正在使用浮点运算_mm_store_ps,尽管您实际上想要存储整数。因此,请使用_mm_store_si128或将结果转发回uint64_t

您还应确保将数组对齐到16字节,因此可以使用更快的对齐加载/存储操作。

#include <emmintrin.h>
#include <nmmintrin.h>
#include <chrono>

int main()
{
  __declspec(align(16)) uint64_t data[200];
  __declspec(align(16)) uint64_t data2[200];
  __declspec(align(16)) uint64_t data3[200];
  __m128i* ptr = (__m128i*) data;
  __m128i* ptr2 = (__m128i*) data2;
  __m128i* ptr3 = (__m128i*) data3;

  for (int i = 0; i < 100; ++i, ++ptr, ++ptr2, ++ptr3)
    *ptr3 = _mm_and_si128(*ptr, *ptr2);
}