在SSE中比较时的奇怪行为

时间:2018-03-19 11:40:35

标签: c++ sse simd

我的代码中没有出现错误。我尝试将unsigned char值的缓冲区与常量进行比较。然后我想根据比较存储1或0。这是我的代码(在结构中):

void operator()(const uint8* src, int32 swidth, int32 sheight, uint8* dst, uint8 value) {
   uint8 t[16];
   __m128i v_one = _mm_set1_epi8((uint8)1);
   __m128i v_value = _mm_set1_epi8(value);

   printf("value = %d\n", value);
   SHOW(t, v_one);
   SHOW(t, v_value);
   std::cout << "****" << std::endl;

   for (int32 i = 0; i < sheight; ++i) {
      const uint8* sdata = src + i * swidth;
      uint8* ddata = dst + i * swidth;
      int32 j = 0;
      for ( ; j <= swidth - 16; j += 16) {
         __m128i s = _mm_load_si128((const __m128i*)(sdata + j));
         __m128i mask = _mm_cmpgt_epi8(s, v_value);

         SHOW(t, s);
         SHOW(t, mask);
         std::cout << std::endl;
      }
   }
}

我的第一行是我所期望的:

value = 100
  1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1
100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100

但后来我的比较是错误的:

214 100 199 203 232  50  85 195  70 141 121 160  93 130 242 233
  0   0   0   0   0   0   0   0   0   0 255   0   0   0   0   0

我真的不知道错误在哪里。

SHOW宏是:

#define SHOW(t, r)                  \
  _mm_storeu_si128((__m128i*)t, r); \
  printf("%3d", (int32)t[0]);       \
  for (int32 k = 1; k < 16; ++k)    \
    printf(" %3d", (int32)t[k]);    \
  printf("\n")

1 个答案:

答案 0 :(得分:4)

您正在将s数组中的元素与value数组进行比较。

value数组中的所有值均为100。 您的s数组中包含多个值。

但是,_mm_cmpgt_epi8适用于已签名的值,因为它们是字节,所以它会将值从-128调整为+127。

所以唯一可能的值是&gt; 100是101到127范围内的值。

因为你在该范围内只有1个值(121),这是唯一一个设置了掩码的值。

要查看此内容,请将uint8 t[16];更改为int8 t[16];,您应该会获得更预期的结果。