快速/简单的CUDA 2D图像卷积方法?

时间:2015-01-09 18:15:33

标签: cuda

你有耐心回答新手吗?

(我根据回复重新提出问题。)

我需要在许多2K x 2K图像(浮点)上卷积内核(16x16浮点数)。 cuBLAS或cuFFT中是否有某些东西(对于cuFFT我假设我必须首先将图像和内核转换为傅里叶空间)才能做到这一点? (假设我不能使用openCV或NPP,除非它是复制源)。

您会选择哪个选项:

  1. 使用CuFFT并将图像和内核转换为傅立叶空间,滤波,然后反FFT?
  2. 按照NVIDA SDK和https://www.evl.uic.edu/sjames/cs525/final.html
  3. 的说法自行滚动
  4. 看一下盒子过滤器,并使用积分(总和图像)。

1 个答案:

答案 0 :(得分:0)

我能够使用UIUC学生论文和Nvidia的白皮书来实现该算法。谢谢罗伯特。