如何在nvidia GPU上计算每个周期(IPC)的理论fp32指令

时间:2014-04-05 17:39:50

标签: cuda gpu gpgpu nvidia

根据http://on-demand.gputechconf.com/gtc-express/2011/presentations/Inst_limited_kernels_Oct2011.pdf第9页,我很难理解费米架构nvidia GPU的每循环理论指令(IPC)是2。

根据编程指南(http://docs.nvidia.com/cuda/cuda-c-programming-guide/#arithmetic-instructions)第5.4.1节的32位浮点数,可以有32个fp32指令/ SM /时钟周期。

这两个数量如何相关?