Question

我在使用OpenCL / OpenGL互操作的多个GPU时遇到了麻烦。我正在尝试编写一个呈现密集计算结果的应用程序。最后它会运行一个优化问题，然后根据结果向屏幕渲染一些东西。作为测试用例，我将从本课程的粒子模拟示例代码开始：http://web.engr.oregonstate.edu/~mjb/sig13/

示例代码创建和OpenGL上下文，然后使用cl_khr_gl_sharing扩展创建一个共享状态的OpenCL上下文。当我使用单个GPU时，一切正常。创建上下文如下所示：

3. create an opencl context based on the opengl context:
  cl_context_properties props[ ] =
  {
      CL_GL_CONTEXT_KHR, (cl_context_properties) glXGetCurrentContext( ),
      CL_GLX_DISPLAY_KHR, (cl_context_properties) glXGetCurrentDisplay( ),
      CL_CONTEXT_PLATFORM, (cl_context_properties) Platform,
      0
  };

  cl_context Context = clCreateContext( props, 1, Device, NULL, NULL, &status );
  if( status != CL_SUCCESS) 
  {
      PrintCLError( status, "clCreateContext: " );
      exit(1);
  }

稍后，该示例使用clCreateFromGLBuffer创建共享CL / GL缓冲区。

现在，我想从两个GPU设备创建一个上下文：

cl_context Context = clCreateContext( props, 2, Device, NULL, NULL, &status );

我已成功打开设备，并且可以查询它们是否都支持cl_khr_gl_sharing，并且两者都可以单独工作。但是，在尝试创建上述上下文时，我得到了

CL_INVALID_OPERATION

这是cl_khr_gl_sharing扩展程序添加的错误代码。在扩展说明（上面链接）中，它说

如果是上下文或共享组对象，则为CL_INVALID_OPERATION    为CGL，EGL，GLX或WGL之一和任何一个指定    以下条件成立：


OpenGL实现不支持窗口系统   上下文或共享组对象的绑定API   指定。

多个属性CL_CGL_SHAREGROUP_KHR，   CL_EGL_DISPLAY_KHR，CL_GLX_DISPLAY_KHR和CL_WGL_HDC_KHR是   设置为非默认值。

两个属性CL_CGL_SHAREGROUP_KHR和   CL_GL_CONTEXT_KHR设置为非默认值。

参数中指定的任何设备都不能   支持共享OpenGL数据存储的OpenCL对象   对象，如第9.12节所述。“

这种描述似乎并不适合我的任何案例。是否不可能使用多个GPU进行OpenCL / OpenGL互操作？还是我有异构硬件？我从枚举设备中打印出一些参数。我刚拿了两个随机的GPU，我可以动手了。

PlatformID: 18483216
Num Devices: 2

-------- Device 00 ---------
CL_DEVICE_NAME: GeForce GTX 285
CL_DEVICE_VENDOR: NVIDIA Corporation
CL_DEVICE_VERSION: OpenCL 1.0 CUDA
CL_DRIVER_VERSION: 304.88
CL_DEVICE_MAX_COMPUTE_UNITS: 30
CL_DEVICE_MAX_CLOCK_FREQUENCY: 1476
CL_DEVICE_TYPE: CL_DEVICE_TYPE_GPU

-------- Device 01 ---------
CL_DEVICE_NAME: Quadro FX 580
CL_DEVICE_VENDOR: NVIDIA Corporation
CL_DEVICE_VERSION: OpenCL 1.0 CUDA
CL_DRIVER_VERSION: 304.88
CL_DEVICE_MAX_COMPUTE_UNITS: 4
CL_DEVICE_MAX_CLOCK_FREQUENCY: 1125
CL_DEVICE_TYPE: CL_DEVICE_TYPE_GPU

cl_khr_gl_sharing is supported on dev 0.
cl_khr_gl_sharing is supported on dev 1.

请注意，如果我创建没有interop部分的上下文（这样props数组如下所示）那么它就会成功创建上下文，但显然不能与应用程序的OpenGL端共享缓冲区。

cl_context_properties props[ ] =
{
   CL_CONTEXT_PLATFORM, (cl_context_properties) Platform,
   0
};

Answer 1

几个相关问题和示例

这是一个纯粹的OpenGL共享方法related example 多个gpus之间的处理
另一个纯OpenGL mulitiple gpu问题
使用多个gpus的producer/consumer example查看生产者源文件以获取当前的调用（看起来特定于窗口，但其他地方的流程类似）。有关详细信息，请参阅glContext


    bool stageProducer::preExecution() 
    {
        if(!glContext::getInstance().makeCurrent(_rc))
        {
            window::getInstance().messageBoxWithLastError("wglMakeCurrent");
            return false;
        }
        glBindFramebuffer(GL_DRAW_FRAMEBUFFER, _fboID);
        return true;
    }

特定于OpenCL，但与此问题相关：

“如果您对queueA（deviceA）上的缓冲区进行排队，那么OpenCL将使用该设备进行写入。但是，如果您在同一上下文中使用queueB（deviceB）上的缓冲区，则OpenCL将识别出deviceA具有最新数据并在使用之前将其移至deviceB。简而言之，只要您使用事件确保没有两个设备同时尝试访问同一个内存对象，OpenCL将会确保每次使用内存对象都有最新数据，无论上次使用哪个设备。“

我假设你把OpenGL从gpus之间共享内存的方程式中按预期工作？

Answer 2

当你打电话给这两行时：

CL_GL_CONTEXT_KHR, (cl_context_properties) glXGetCurrentContext( ), CL_GLX_DISPLAY_KHR, (cl_context_properties) glXGetCurrentDisplay( ),

调用需要来自具有新OpenGL上下文的新线程内部。通常，每个线程一次只能为一个设备关联一个OpenCL上下文和一个OpenGL上下文。

具有多个GPU的OpenCL / OpenGL Interop

2 个答案: