我正在开发一款涉及某些物理计算的iPhone应用程序,每秒进行数千次。我正在努力优化代码以提高帧速率。我正在寻求改进的其中一个方面是反平方根。现在,我正在使用Quake 3 fast inverse square root方法。然而,在做了一些研究之后,我听到了there is a faster way by using the NEON指令集。我不熟悉内联汇编,无法弄清楚如何使用NEON。我尝试实现math-neon库,但是由于大多数基于NEON的函数缺少return
,我遇到了编译器错误。
应用内测试:(当前位于应用商店中且修改了invsqrt方法的应用)
“正式”测试(吞噬我的手机CPU的应用程序。计算每种方法通过10000000随机生成的花车阵列所需的时间)
虽然在应用程序性能测试中,地震与霓虹灯的距离太近而无法确定,但在第一次测试中,地震对比1 / sqrtf()非常明显,第二次测试与其值非常一致输出。但最重要的是应用程序性能,所以我将根据该测试做出最终决定。
答案 0 :(得分:5)
accepted answer的question you've linked已经提供了答案,但没有说清楚:
#import <arm_neon.h>
void foo() {
float32x2_t inverseSqrt = vrsqrte_f32(someFloat);
}
iOS SDK已经提供了标题和功能。
答案 1 :(得分:2)
https://code.google.com/p/math-neon/source/browse/trunk/math_sqrtf.c&lt; - 那里有一个invsqrt的霓虹灯实现,你应该能够按原样复制汇编位