我在查明几个英特尔SSE操作的NEON等效性时遇到了一些麻烦。看起来NEON不能同时处理整个Q寄存器(128位值数据类型)。我没有在arm_neon.h标题或NEON intrinsics reference中找到任何内容。
我想做的是以下内容:
// Intel SSE
// shift the entire 128 bit value with 2 bytes to the right; this is done
// without sign extension by shifting in zeros
__m128i val = _mm_srli_si128(vector_of_8_s16, 2);
// insert the least significant 16 bits of "some_16_bit_val"
// the whole thing in this case, into the selected 16 bit
// integer of vector "val"(the 16 bit element with index 7 in this case)
val = _mm_insert_epi16(val, some_16_bit_val, 7);
我已经看过NEON提供的转换操作但找不到相同的方法来执行上述操作(我对NEON没有多少经验)。是否有可能做到以上(我想这是我只是不知道如何)? 任何指针都非常感激。
答案 0 :(得分:6)
您需要VEXT指令。你的例子看起来像是:
int16x8_t val = vextq_s16(vector_of_8_s16, another_vector_s16, 1);
此后,val
的0-111位将包含vector_of_8_s16
的16-127位,val
的位112-127将包含{{1}的0-15位}}