应用错误收集

在GPU上优化块数到最大驻留块数

时间：2012-01-19 01:57:38

标签： cuda

是否有可能确定整个GPU上最大驻留块的数量，以避免重复内核执行作为全局障碍的必要性？

更确切地说，我希望避免将部分结果复制到全局内存和内核执行成本的成本。因此，工作将公平地分配给每个块，并且块将相当地交替计算，直到其中一个块找到结果。

非常感谢。

1 个答案:

答案 0 :(得分：0)

This线程可能对您有用。通常，如果任务完全并行，则不会为剩余的数据启动新内核。相反，你可以在内核中循环。