如何确定给定计算能力的设备上给定内核的最大可能每个时钟指令(IPC)的范围?
给定内核的指令组合如何影响最大可能的IPC?
示例1:具有60%使用32位通用ALU的指令和40%需要在CC 2.0设备上使用SFU ALU的指令的内核的最大IPC是多少? / p>
示例2 :鉴于两个CC上的资源比率不同,CC 2.1设备的上述答案如何变化? 2.0 SM有32个32位ALU和4个SFU,因此比率为8比1.而2.1 SM有48个32位ALU和8个SFU,所以比率为6比1.
示例3:将64位浮点指令替换为SFU指令时,上述答案如何变化?
供参考: