我使用OpenCL在gpu上计算了一些矩阵,现在我需要使用OpenCV对它进行一些过滤。如何以最小的开销做到这一点?
cl::Buffer buffer;
cl::Kernel kernel;
kernel = cl::Kernel(program, "functionName", &err);
buffer = cl::Buffer(context, CL_MEM_READ_WRITE, size, NULL, &err);
kernel.setArg(0, buffer);
queue_IQ.enqueueNDRangeKernel(kernel, cl::NullRange, cl::NDRange(size), cl::NullRange, NULL, NULL);
// Here, I would like to map the content of buffer to cv::Mat.
答案 0 :(得分:1)
可以通过很少的开销来实现:
例如,如果要使用浮点数:
// cl::Buffer buffer
float* dataOnGPU = static_cast<float *>(queue_IQ.enqueueMapBuffer(buffer, CL_TRUE, CL_MAP_READ, 0, dataSize, NULL, NULL, NULL)); // map GPU memory to float*
cv::Mat dataInMat(height, width, CV_32F, dataOnGPU); // interface float* with cv::Mat
...
// Once done, you can unmap
queue_IQ.enqueueUnmapMemObject(buffer, dataOnGPU, NULL, NULL);
有关更多信息,请参见: