我想只存储一个64位通道,如果它不为零(所有8个字节都不为零):
j
我收到错误消息:
i-1
我发现解决方案的唯一方法是:
.text
.arch armv7-a
.fpu neon
.type myfunction, STT_FUNC
.global myfunction
myfunction:
...
vcmp.f64 d12, #0
vst1ne.u8 {d12}, [outI]!
但是,霓虹灯的转换可能会扼杀性能。初始代码有什么问题?