我对openCL和GPGPU编程很新,想澄清一些事情: 在Nvidia卡SM上的工作组中,工作组是否像warp一样交错? 或者它们总是被序列化,这意味着一个工作组必须在下一个工作组进入之前退休?
感谢
尤金
答案 0 :(得分:1)
你采取了错误的做法。你根本不知道他们将如何安排。
实际上这是并行方法中的KEY元素,您可以运行数百万个线程,而它们之间几乎不需要同步。如果你需要知道如何同步它们,那将是一个地狱。
此外,并非给定设备始终以相同的顺序运行工作组。每次发布的顺序不同。并行工作组的数量也各不相同,因此它可以是4个组的组(例如)。
在设计时考虑到这一点,你应该完全分离每个工作项,使其独立工作。