OpenCL扫描码

时间:2015-09-05 04:16:08

标签: opencl nvidia prefix-sum

我正在寻找在OpenCL中快速实现scan(prefixsum)。我发现的最好的东西是在Nvidia SDK中,但它已经过时了(2010年)。 有没有人知道OpenCL中Scan的任何其他实现?

2 个答案:

答案 0 :(得分:1)

OpenCL中有几种扫描操作的开源实现:

  • CLOGS,一个用于OpenCL C ++ API之上的高级操作的库。
  • Boost.Compute,一个用于OpenCL的C ++ GPU计算库。
  • VexCL,一个用于OpenCL / CUDA的C ++向量表达式模板库。
  • Bolt,一个针对GPU优化的C ++模板库。

CLOGS的作者在这些实现中编写了paper比较扫描(和排序)操作的性能。

答案 1 :(得分:0)