我有一个案例,在enqueuer内核之后,获取一个事件并设置回调以进行性能分析。例如:
cl::Event event;
cl::CommandQueue queue(context, devices[0], 0, &err);
queue.enqueueNDRangeKernel(kernel, cl::NullRange, cl::NDRange(4,4), cl::NullRange, NULL, &event);
event.setcallback(CL_COMPLETE, &EventCallback);
Callback是一个检查内核执行时间的函数。
void CL_CALLBACK EventCallback(cl_event event, cl_int, void* pUserData)
{
cl_int err = CL_SUCCESS;
cl_ulong submitted = 0, end = 0;
clGetEventProfilingInfo(event, CL_PROFILING_COMMAND_START, sizeof(cl_ulong), &start, NULL);
clGetEventProfilingInfo(event, CL_PROFILING_COMMAND_END, sizeof(cl_ulong), &end, NULL);
...
}
我忽略了这里的返回错误代码检查,但有时clGetEventProfilingInfo()方法返回CL_INVALID_EVENT。如果运行debug并在断回内部放置断点,则不会发生这种情况。
我认为这可能是因为cl :: Event对象的离开范围太快而且在调用回调之前被释放,但无法确认。
所以我的问题是在离开范围之前是否应该明确保留事件?或者还有其他原因?
答案 0 :(得分:2)
我弄明白,在设置回调之前,调用clRetainEvent(),并在EventCallback结束时调用clReleaseEvent(),这样事件将一直有效直到回调结束。在最后没有释放的情况下,调试器会将其报告为内存泄漏。