在OpenCL兼容设备上复制全局数据会提高性能吗?

时间:2014-02-14 00:31:51

标签: opencl gpu gpgpu amd-processor

我有一个非常小的数据集,但足够大,以至于它不适合当前市场上任何GPU中的工作空间或私有存储器。这意味着每个内核必须访问GPU上全局内存中的数据。如果我将此数据复制到全局内存中的多个副本,是否可以提高性能/减少延迟,还是内存控制器是限制性的,并且一次只允许一个内核访问全局内存?如果这是特定于设备的,是否有任何具有此功能的型号?

1 个答案:

答案 0 :(得分:1)

这受视频卡内存控制器的限制,同一数据的多个副本不会对您有所帮助。我不知道有一个用于全局访问的内存控制器的gpu。

您的内存访问模式将极大地影响内核的整体吞吐量。您是否有需要优化的特定示例/内核?