标签: cuda
你有耐心回答新手吗?
(我根据回复重新提出问题。)
我需要在许多2K x 2K图像(浮点)上卷积内核(16x16浮点数)。 cuBLAS或cuFFT中是否有某些东西(对于cuFFT我假设我必须首先将图像和内核转换为傅里叶空间)才能做到这一点? (假设我不能使用openCV或NPP,除非它是复制源)。
您会选择哪个选项:
答案 0 :(得分:0)
我能够使用UIUC学生论文和Nvidia的白皮书来实现该算法。谢谢罗伯特。