假设SM已经填充了8个块,每个块64个线程。
这给了我们2个warp / block,总共16个warp。 SM可以在warp之间交替以隐藏延迟。这些经线必须属于同一个块,或者块5的经线是否可以用第8块的经线代替?
答案 0 :(得分:1)
是的,SM调度程序可以“替换”或选择warp来从驻留在该SM上的任何调度进行调度。
事实上,SM具有最大可能的扭曲负载(当前,对于某些GPU而言为64)或线程负载(当前,对于某些GPU而言为2048)超过单个块的可能限制(1024,当前,对于所有最近的CUDA工具包支持的GPU是这样的,SM可以从不同的块中选择warp进行调度,以提高延迟隐藏的可能性。