刚开始使用内在函数,然后点击暴露无知的东西。这是我所看到的人造版本(VS2015):
__m128i test;
//test.m128i_u16[0] = 127;
//test.m128i_u16[1] = 128;
//test.m128i_u16[2] = 129;
//test.m128i_u16[3] = 130;
//test.m128i_u16[4] = 131;
//test.m128i_u16[5] = 132;
//test.m128i_u16[6] = 133;
//test.m128i_u16[7] = 134;
test.m128i_u16[0] = 50;
test.m128i_u16[1] = 70;
test.m128i_u16[2] = 90;
test.m128i_u16[3] = 110;
test.m128i_u16[4] = 50;
test.m128i_u16[5] = 70;
test.m128i_u16[6] = 90;
test.m128i_u16[7] = 110;
__m128i result = _mm_packus_epi16 (test, test);
因此,最后一个命令“使用无符号饱和度将打包的16位整数从a和b转换为打包的8位整数,并将结果存储在dst中”。 如果我如图所示运行,我会得到我期望的结果:
- m128i_i8 char[16]
[0] 50 char
[1] 70 char
[2] 90 chara
[3] 110 char
[4] 50 char
[5] 70 char
[6] 90 char
[7] 110 char
[8] 50 char
[9] 70 char
[10] 90 char
[11] 110 char
[12] 50 char
[13] 70 char
[14] 90 char
[15] 110 char
但如果我交换上面的输入(使用注释值集),那么我得到的是整数饱和结果: -
m128i_i8 char[16]
[0] 127 char
[1] -128 char
[2] -127 char
[3] -126 char
[4] -125 char
[5] -124 char
[6] -123 char
[7] -122 char
[8] 127 char
[9] -128 char
[10] -127 char
[11] -126 char
[12] -125 char
[13] -124 char
[14] -123 char
[15] -122 char
我在这里缺少什么?解释,错误的命令?
答案 0 :(得分:1)
您似乎将结果向量打印为保留int8_t
,而不是uint8_t
元素,即使您执行了无符号饱和。所以127以上的每个值都打印为负数。
因此,饱和到0xFF的所有内容都将打印为-1。 (饱和为0的所有内容都将打印为0,但没有任何int16_t输入为负数。)
另请注意,PACKUSWB将其输入视为签名,以防不明确。