我试图对图像中的所有像素求和,并使用CUDA NPP库获得所有像素的平均值。我的图片是尺寸8-bit unsigned char grayscale
的{{1}}图片。我试图遵循声明指针所需的所有规则,并将相应的NPP类型指针传递给NPP函数。
但是,当我对代码执行GPU错误检查时,我得到w256 x h1024
。我试着调试它但是,我似乎无法弄清楚我哪里出错了,我想要一些帮助吗?
我正在使用OpenCV进行处理,因此会出现一些OpenCV代码。
编辑:代码已更新
unknown error
答案 0 :(得分:1)
partialSum
中的nppiSum_8u64s_C1R
参数应该是设备分配的内存。
此外,您还可以分配图像大小的临时缓冲区。有一个名为nppiSumGetBufferHostSize_8u64s_C1R
的函数可以为您提供临时缓冲区的确切大小,该大小可能比图像本身大(不太可能进行简单的求和,但可能)。
并且总是检查NPP中的返回值和Cuda一样。 <{1}}可能无法在您的案例中返回nppiSum_8u64s_C1R
。