ARM Neon:用于减法的VPADAL

时间:2011-11-22 19:32:29

标签: arm simd neon

我正在使用VPADAL.U32指令来大大提高我的加法代码速度。但是,我需要用积累和携带来减去(正是我得到的东西)。

一般的想法或可能吗?

从我可以收集到的,我需要减少我的第二个操作数,然后不是它的位...执行VPADAL,然后对1进行位测试,并从结果进位中减去1 (得到0或-1 - 我的积累)。

我在某个地方错过了一种神秘的技术吗?

1 个答案:

答案 0 :(得分:0)

您可以使用VPADDL对加数进行成对求和并将宽度加倍,然后使用VQSUB从总数中减去该项。