CUDA NPP - GPU错误检查时的未知错误

时间:2014-03-20 22:49:49

标签: c++ cuda npp

我试图对图像中的所有像素求和,并使用CUDA NPP库获得所有像素的平均值。我的图片是尺寸8-bit unsigned char grayscale的{​​{1}}图片。我试图遵循声明指针所需的所有规则,并将相应的NPP类型指针传递给NPP函数。

但是,当我对代码执行GPU错误检查时,我得到w256 x h1024。我试着调试它但是,我似乎无法弄清楚我哪里出错了,我想要一些帮助吗?

我正在使用OpenCV进行处理,因此会出现一些OpenCV代码。

编辑:代码已更新

unknown error

1 个答案:

答案 0 :(得分:1)

partialSum中的nppiSum_8u64s_C1R参数应该是设备分配的内存。

此外,您还可以分配图像大小的临时缓冲区。有一个名为nppiSumGetBufferHostSize_8u64s_C1R的函数可以为您提供临时缓冲区的确切大小,该大小可能比图像本身大(不太可能进行简单的求和,但可能)。

并且总是检查NPP中的返回值和Cuda一样。 <{1}}可能无法在您的案例中返回nppiSum_8u64s_C1R