在最近的nVIDIA GPU uarchitectures中,单个流式多处理器似乎被分解为4个子单元;他们每个人都有水平或垂直的栏杆。 8' square',对应于不同的功能单元:整数运算,32位触发器,64位触发器和加载/存储。单个warp调度程序似乎与每个这样的" quarter-SM"。
相关联现在,在CUDA编程模型中,每个warp(= 32个线程)的线程被指令锁定在一起。但是,当实际执行工作时,并且在某种情况下,例如,只有经线中的线程的后半部分或后四分之一处于活动状态 - 这些子经线可以安排到2或3个四分之一SM,而另一个季度-SM做了一些其他的工作?
答案 0 :(得分:1)
根据罗伯特的评论,不会发生子扭曲调度 - 调度总是完全扭曲(至少就使用芯片的人而言)。在内部,可能会或可能不会出现子扭曲调度的情况。