标签: opencl nvidia prefix-sum
我正在寻找在OpenCL中快速实现scan(prefixsum)。我发现的最好的东西是在Nvidia SDK中,但它已经过时了(2010年)。 有没有人知道OpenCL中Scan的任何其他实现?
答案 0 :(得分:1)
OpenCL中有几种扫描操作的开源实现:
CLOGS的作者在这些实现中编写了paper比较扫描(和排序)操作的性能。
答案 1 :(得分:0)
如果您的设备支持2.0,那么请使用内置操作。
https://stackoverflow.com/a/32394920/4877550
http://developer.amd.com/community/blog/2014/11/17/opencl-2-0-device-enqueue/