根据http://on-demand.gputechconf.com/gtc-express/2011/presentations/Inst_limited_kernels_Oct2011.pdf第9页,我很难理解费米架构nvidia GPU的每循环理论指令(IPC)是2。
根据编程指南(http://docs.nvidia.com/cuda/cuda-c-programming-guide/#arithmetic-instructions)第5.4.1节的32位浮点数,可以有32个fp32指令/ SM /时钟周期。
这两个数量如何相关?
答案 0 :(得分:2)