float a[4] = {1,2,3,4}, b[4] = {4,3,2,1};
uint32_t c[4];
int main() {
__m128 pa = _mm_loadu_ps(a);
__m128 pb = _mm_loadu_ps(b);
__m128 pc = _mm_cmpgt_ps(pa, pb);
_mm_storeu_ps((float*)c, pc);
for (int i = 0;i < 4; ++i) printf("%u\n", c[i]);
return 0;
}
_mm_storeu_ps((float*)c, pc)
的正确指示是什么?
在这里,c是一个整数数组......我不认为这种方式好,更好吗?
答案 0 :(得分:7)
有两条说明可将__m128
(float
向量)转换为SSE2中的__m128i
(int32_t
向量):_mm_cvtps_epi32
(带舍入)和{ {3}}(截断)。
__m128i vi = _mm_cvttps_epi32(pc);
_mm_storeu_si128((__m128i *)c, vi);
如果您无法使用SSE2,则应在将float
存储到int
数组后将pc
数组转换为float
数组。
float d[4];
_mm_storeu_ps(d, pc);
c[0] = (int)d[0]; c[1] = (int)d[1]; c[2] = (int)d[2]; c[3] = (int)d[3];