有没有办法检查__m128i变量中的所有位/字节/字等是否为0?
在我的应用程序中,我必须检查__m128i变量中包含的所有整数是否为零。我是否必须提取它们并分别进行比较?
编辑:
int next = 0;
do{
//some code
next = idata.m128i_i32[0] + idata.m128i_i32[1] + idata.m128i_i32[2] + idata.m128i_i32[3];
}while(next > 0);
我需要的是检查idata是否全为零而不必访问每个单独的元素,如果它们是...则退出循环...
根据Harold的评论,这是解决方案:
__m128i idata = _mm_setr_epi32(i,j,k,l);
do{
//some code
}while( !_mm_testz_si128(idata, idata) );
如果idata中每个DW的所有低位都为0,这将退出循环...感谢hraold!
答案 0 :(得分:9)
_mm_testz_si128是SSE4.1,某些CPU(例如Intel Atom,AMD Phenom)不支持SSE4.1
这是与SSE2兼容的变体
inline bool isAllZeros(__m128i xmm) {
return _mm_movemask_epi8(_mm_cmpeq_epi8(xmm, _mm_setzero_si128())) == 0xFFFF;
}
答案 1 :(得分:4)
就像Paul R评论我的原帖:
“你不需要为PTEST
的第二个参数初始化一个伪参数,即代替_mm_testz_si128(idata, _mm_set1_epi32(0xFFFF))
,你可以只测试一个值。”
ptest
只用一条指令完成整个工作。
这有帮助。