霓虹64位无效:将向量与零进行比较

时间:2017-12-29 03:02:18

标签: assembly neon arm64 micro-optimization

我想比较霓虹灯64位中矢量的所有16个元素,如果所有都等于零,则有一个分支。

现在,我有:

uaddlv h1, v0.16b
umov w0, v1.s[0]
cmp w0, #0
beq .exit

我也尝试过:

uaddlv h1, v0.16b
fcmp s1, #0.0
beq .exit

这是对的吗?有办法做得更好吗?只用一条指令?

1 个答案:

答案 0 :(得分:2)

This should work

umaxv h1, v0.16b // Get max value across vector
umov w0, v1.s[0] // Move to arm register
cbz w0 .exit // Branch if equal to zero

Using intrinsics in C...

if(vmaxvq_u16(vector) == 0) { // Is max value zero
    goto exit; // Goto label in C code
}