OpenCL中完全独立计算的工作大小

时间:2013-08-19 12:51:41

标签: parallel-processing opencl gpgpu

我有一个2D矩阵,我希望通过应用一个仅依赖于矩阵中的坐标和编译时设置的值的函数来修改每个值。由于每次这样的计算之间不需要同步,在我看来工作组大小实际上可能是1,工作组的数量等于矩阵中元素的数量。

我的问题是,这是否会实际产生预期的结果,或者是否其他力量在这里起作用可能会更好地为这些值设置不同的设置?

1 个答案:

答案 0 :(得分:2)

我的推荐:只需将全局大小设置为2D矩阵大小,将本地大小设置为NULL。这将使编译器为您选择最佳的本地大小。

在您的具体情况下,本地尺寸不需要任何形状。实际上,任何价值都可以完成工作,但性能可能会有所不同。您可以手动为不同的HW进行调整。但让编译器为您完成这项工作更容易。而且它更便携。