Question

float a[4] = {1,2,3,4}, b[4] = {4,3,2,1};
uint32_t c[4];

int main() {

    __m128 pa = _mm_loadu_ps(a);

    __m128 pb = _mm_loadu_ps(b);
    __m128 pc = _mm_cmpgt_ps(pa, pb);
    _mm_storeu_ps((float*)c, pc);
    for (int i = 0;i  < 4; ++i) printf("%u\n", c[i]);
    return 0;
}

_mm_storeu_ps((float*)c, pc)的正确指示是什么？在这里，c是一个整数数组......我不认为这种方式好，更好吗？

Answer 1

有两条说明可将__m128（float向量）转换为SSE2中的__m128i（int32_t向量）：_mm_cvtps_epi32（带舍入）和{ {3}}（截断）。

__m128i vi = _mm_cvttps_epi32(pc);
_mm_storeu_si128((__m128i *)c, vi);

如果您无法使用SSE2，则应在将float存储到int数组后将pc数组转换为float数组。

float d[4];
_mm_storeu_ps(d, pc);
c[0] = (int)d[0]; c[1] = (int)d[1]; c[2] = (int)d[2]; c[3] = (int)d[3];

如何将__m128反转为整数

1 个答案: