标签: opencl parallel-processing
我有用于并行(独占)扫描算法的优化代码,用OpenCL编写。 我已经读过矢量的内部(点)乘积基于并行缩减,但我想知道是否有可能使用这个已经完成的扫描算法用于此目的?
答案 0 :(得分:0)
定义的点积是一种约简算法。减少算法并不太难实现,即使是适度优化的版本也比扫描算法快得多。最好是编写一个可以使用的快速缩减算法。