我尝试在MIC(Intel Xeon Phi)的C代码中生成内联asm。我的指令jknzd有问题。
这是我的代码片段:
float *A = (float*)_mm_malloc(N * sizeof(float), 64);
int32_t* Indx = (int32_t*)_mm_malloc(N * sizeof(int32_t), 64);
__m512i idx = __cdecl _mm512_load_epi32(&Indx[i]);
asm (
"kxnor %%k1, %%k1\n\t"
"1:" "vgatherpf0dps (%0, %1, 4){{%%k1}}\n\t"
"jknzd 1b, %%k1"
:
:"r"(A),"x"(idx)
:"%r8d", "%k1"
);
编译器是icc-13.0.1,选项:-mmic -lrt -O3。 当我尝试编译时,我收到此消息:
/tmp/icc1XDD1vas_.s:汇编程序消息: /tmp/icc1XDD1vas_.s:237:错误:无效的字符'{'开头操作数1
{rz-sae}' /tmp/icc1XDD1vas_.s:250: Error: invalid char '{' beginning operand 1
{rn-sae}' /tmp/icc1XDD1vas_.s:254:错误:无效的字符'{'开头操作数1{rn-sae}' /tmp/icc1XDD1vas_.s:260: Error: invalid char '{' beginning operand 1
{rn-sae}' /tmp/icc1XDD1vas_.s:263:错误:无效的字符'{'开头操作数1{rn-sae}' /tmp/icc1XDD1vas_.s:264: Error: invalid char '{' beginning operand 1
{rn-sae}' /tmp/icc1XDD1vas_.s:360:错误:无效的字符'{'开头操作数1{rz-sae}' /tmp/icc1XDD1vas_.s:373: Error: invalid char '{' beginning operand 1
{rn-sae}' /tmp/icc1XDD1vas_.s:375:错误:无效的字符'{'开头操作数1{rn-sae}' /tmp/icc1XDD1vas_.s:378: Error: invalid char '{' beginning operand 1
{rn-sae}' /tmp/icc1XDD1vas_.s:383:错误:无效的字符'{'开头操作数1{rn-sae}' /tmp/icc1XDD1vas_.s:385: Error: invalid char '{' beginning operand 1
{rn-sae}' /tmp/icc1XDD1vas_.s:398:错误:无效的字符'{'开头操作数1{rz-sae}' /tmp/icc1XDD1vas_.s:402: Error: invalid char '{' beginning operand 1
{rn-sae}' /tmp/icc1XDD1vas_.s:415:错误:无效的字符'{'开头操作数1{rn-sae}' /tmp/icc1XDD1vas_.s:417: Error: invalid char '{' beginning operand 1
{rn-sae}' /tmp/icc1XDD1vas_.s:421:错误:无效的字符'{'开头的操作数1{rn-sae}' /tmp/icc1XDD1vas_.s:422: Error: invalid char '{' beginning operand 1
{rn-sae}'
如果有一个简单的跳转,比如“jmp 1b”就可以了。我做错了什么?
答案 0 :(得分:0)
这可能不是您想要的,但您可以使用内在函数测试掩码寄存器中的非零值。
从英特尔MIC论坛上的这个thread,你可以看到这样的解决方案:
if(!_mm512_kortestz(mask, mask)) // Returns true if at least one bit is 1
{}