Question

我有一个案例，在enqueuer内核之后，获取一个事件并设置回调以进行性能分析。例如：

cl::Event event;
cl::CommandQueue queue(context, devices[0], 0, &err);
queue.enqueueNDRangeKernel(kernel, cl::NullRange, cl::NDRange(4,4), cl::NullRange, NULL, &event);
event.setcallback(CL_COMPLETE, &EventCallback);

Callback是一个检查内核执行时间的函数。

void CL_CALLBACK EventCallback(cl_event event, cl_int, void* pUserData)
{
    cl_int err = CL_SUCCESS;
    cl_ulong submitted = 0, end = 0;
    clGetEventProfilingInfo(event, CL_PROFILING_COMMAND_START, sizeof(cl_ulong), &start, NULL);
    clGetEventProfilingInfo(event, CL_PROFILING_COMMAND_END, sizeof(cl_ulong), &end, NULL);
    ...
}

我忽略了这里的返回错误代码检查，但有时clGetEventProfilingInfo（）方法返回CL_INVALID_EVENT。如果运行debug并在断回内部放置断点，则不会发生这种情况。

我认为这可能是因为cl :: Event对象的离开范围太快而且在调用回调之前被释放，但无法确认。

所以我的问题是在离开范围之前是否应该明确保留事件？或者还有其他原因？

Answer 1

我弄明白，在设置回调之前，调用clRetainEvent（），并在EventCallback结束时调用clReleaseEvent（），这样事件将一直有效直到回调结束。在最后没有释放的情况下，调试器会将其报告为内存泄漏。

clSetEventCallback，是否应该显式保留事件？

1 个答案: