如何将OpenCL GPU内存映射到OpenCV矩阵?

时间:2019-04-25 13:13:52

标签: opencv opencl

我使用OpenCL在gpu上计算了一些矩阵,现在我需要使用OpenCV对它进行一些过滤。如何以最小的开销做到这一点?

cl::Buffer buffer;
cl::Kernel kernel;
kernel = cl::Kernel(program, "functionName", &err);
buffer = cl::Buffer(context, CL_MEM_READ_WRITE, size, NULL, &err);
kernel.setArg(0, buffer);
queue_IQ.enqueueNDRangeKernel(kernel, cl::NullRange, cl::NDRange(size), cl::NullRange, NULL, NULL);

// Here, I would like to map the content of buffer to cv::Mat.

1 个答案:

答案 0 :(得分:1)

可以通过很少的开销来实现:

  1. 将gpu内存映射到一个指针(在我的情况下为float *)。
  2. 使用此指针创建一个opencv矩阵。注意,opencv矩阵构造函数不会为指针复制或分配新的内存,而是会初始化矩阵头以指向指定的数据(在这种情况下为gpu)。

例如,如果要使用浮点数:

// cl::Buffer buffer
float* dataOnGPU = static_cast<float *>(queue_IQ.enqueueMapBuffer(buffer, CL_TRUE, CL_MAP_READ, 0, dataSize, NULL, NULL, NULL)); // map GPU memory to float*
cv::Mat dataInMat(height, width, CV_32F, dataOnGPU); // interface float* with cv::Mat

...

// Once done, you can unmap
queue_IQ.enqueueUnmapMemObject(buffer, dataOnGPU, NULL, NULL);
  

有关更多信息,请参见: