我正在使用SSE2内在函数来优化我的应用程序的瓶颈,并提出以下问题:
ddata = _mm_xor_si128(_mm_xor_si128(
_mm_sll_epi32(xdata, 0x7u), _mm_srl_epi32(tdata, 0x19u)), xdata);
在Microsoft C ++编译器上,这将无法编译,因为类型__m128i
和unsigned int
(传递给_mm_sll_epi32
指令)不可互换。
为什么会如此?如何将任意unsigned int
值传递给_mm_sll_epi32
?
_m128i
是:
typedef union __declspec(intrin_type) _CRT_ALIGN(16) __m128i {
__int8 m128i_i8[16];
__int16 m128i_i16[8];
__int32 m128i_i32[4];
__int64 m128i_i64[2];
unsigned __int8 m128i_u8[16];
unsigned __int16 m128i_u16[8];
unsigned __int32 m128i_u32[4];
unsigned __int64 m128i_u64[2];
} __m128i;
答案 0 :(得分:11)
应该是:
ddata = _mm_xor_si128(_mm_xor_si128(
_mm_slli_epi32(xdata, 0x7), _mm_srli_epi32(tdata, 0x19)), xdata);
请注意i
表示“立即”。如果没有这个,移位内在函数需要一个向量作为第二个参数。
答案 1 :(得分:6)
您可以使用_mm_slli_epi32
(请注意 i ),同样_mm_srli_epi32
。它需要一个整数参数而不是__m128i
。