标签: arm simd neon
我正在使用VPADAL.U32指令来大大提高我的加法代码速度。但是,我需要用积累和携带来减去(正是我得到的东西)。
VPADAL.U32
从我可以收集到的,我需要减少我的第二个操作数,然后不是它的位...执行VPADAL,然后对1进行位测试,并从结果进位中减去1 (得到0或-1 - 我的积累)。
VPADAL
我在某个地方错过了一种神秘的技术吗?
答案 0 :(得分:0)
您可以使用VPADDL对加数进行成对求和并将宽度加倍,然后使用VQSUB从总数中减去该项。