我正致力于优化使用浮点指令的函数。
对于基准测试,我需要知道指令的执行延迟,以了解理论上的可能性能。
我找到了A57的这样的手册:http://infocenter.arm.com/help/topic/com.arm.doc.uan0015b/Cortex_A57_Software_Optimization_Guide_external.pdf
但是,我没有为A53找到任何此类文件。 我错过了什么吗? 是否有适用于A53的优化指南?
答案 0 :(得分:0)
一些圣人独立测量指令延迟。
http://hardwarebug.org/2014/05/15/cortex-a7-instruction-cycle-timings/
请注意,a53是从a7演变而来的,因此时间可能相似。它与a57完全不同,后者具有更长的流水线和乱序执行。
答案 1 :(得分:0)
不幸的是,据我所知,关于Cortex A53循环计时的信息很少。至关重要的是,根据我的测量,NEON延迟与Cortex A7上发生的延迟完全不同。
我已经written microbenchmarking software弄清了有关指令周期时序的情况。 the paper中有一些与此工作相关的表(也在IACR eprint中)。