ipad2霓虹灯浮点速度与ipad1相比

时间:2011-06-21 19:52:09

标签: ipad floating-point arm ipad-2 neon

在ipad1和ipad2上测试NEON指令时,我注意到ipad2上的代码几乎没有加速,其中大多数功能在ipad2上的运行速度比在ipad1上快得多。

这适用于像VMUL,VLD1,VADD和VSUB等指令,使用像q0这样的四字字寄存器来处理FFT。

另外我注意到苹果自己的FFT函数vdsp_fft_zrip也没有为ipad2加速。

所以问题是,对于四字SIMD类型的指令,ipad2 NEON的执行速度是否比ipad1 NEON更快?

2 个答案:

答案 0 :(得分:1)

与其他核心相比,A4上的NEON单元非常强大。 A5的其余核心比A4大大提高,但NEON单元的性能或多或少没有变化。你所期待的是预期的。

当然,现在有两个内核,所以如果你可以利用它们,你仍然可以看到显着的加速。此外,A5上的双精度计算与A4完全相同,因为它现在已完全流水线化。

答案 1 :(得分:0)

即使在最近推出的64位ARM上,NEON也会保持相同的状态。

NEON不会因时钟速度的提高而受益匪浅。 NEON已经非常快,它花费了大部分功能执行时间来等待内存中的数据。