大规模并行1D卷积

时间:2015-01-20 22:50:18

标签: c++ opencl fft convolution arrayfire

我现在正在使用ArrayFire(OpenCL,而不是cuda),我想知道是否有任何方法可以执行一个非常大的(50M + 32位浮点)向量的几个并行1D卷积(计算移动平均值)。我已经看到了一些例子,但是在最近的开源版本中,一些较旧的功能不起作用。窗口大小实际上很大(1k-10k)。 FFT方法(卷积的乘积)会比直接卷积更快吗?

0 个答案:

没有答案