更新SSBO内容

时间:2018-08-17 16:42:21

标签: opengl glsl shader compute-shader

我正在尝试在Compute Shader上进行简单的计算,在经过一轮计算后,我将该轮的结果返回给Shader作为第二轮的输入。

我的Compute着色器如下所示:

#version 440 core

layout(std430, binding = 0) buffer Result{
  float out_picture[];
};
layout(std430, binding = 1) buffer In_p1{
  float in_p1[];
};
layout(local_size_x = 1000) in;

void main() {
  in_p1[gl_GlobalInvocationID.x] = 1.0f;
  out_picture[gl_GlobalInvocationID.x] = out_picture[gl_GlobalInvocationID.x] + in_p1[gl_GlobalInvocationID.x];

}

她是我的OpenGL代码:

int main(int argc, char* argv[]) {

    std::vector<float> result_container;
    std::vector<SSBO> ssbo_container;
    SSBO ssbo_result;

    ssbo_result.NUM_PIX = 1920*1080*4;
    ssbo_result.WORK_GROUP_SIZE = 1000;
    result_container.reserve(ssbo_result.NUM_PIX * sizeof(float));

    glGenBuffers(1, &ssbo_result.handle);
    glBindBufferBase(GL_SHADER_STORAGE_BUFFER, 0, ssbo_result.handle);
    glBufferData(GL_SHADER_STORAGE_BUFFER, ssbo_result.NUM_PIX * sizeof(float), NULL, GL_DYNAMIC_DRAW);

    for(unsigned int i = 1; i < 2; i++){
      SSBO ssbo;
      glGenBuffers(1, &ssbo.handle);
      glBindBufferBase(GL_SHADER_STORAGE_BUFFER, i, ssbo.handle);
      glBufferData(GL_SHADER_STORAGE_BUFFER, ssbo_result.NUM_PIX * sizeof(float), NULL, GL_DYNAMIC_DRAW);
      ssbo_container.push_back(ssbo);
    }

    while (!g_win.shouldClose()) {

      std::cout << "container:" << result_container[0] << std::endl;

      glUseProgram(g_avg_program);
      glDispatchCompute(ssbo_result.NUM_PIX / ssbo_result.WORK_GROUP_SIZE, 1, 1);
      glMemoryBarrier(GL_SHADER_STORAGE_BARRIER_BIT);
      glBindBufferBase(GL_SHADER_STORAGE_BUFFER, 0, 0);

      glBindBuffer(GL_SHADER_STORAGE_BUFFER, ssbo_result.handle);
      GLfloat *ptr = (GLfloat *) glMapBuffer(GL_SHADER_STORAGE_BUFFER, GL_READ_ONLY);
      memcpy(result_container.data(), ptr, ssbo_result.NUM_PIX * sizeof(float));
      glUnmapBuffer(GL_SHADER_STORAGE_BUFFER);

      glBindBuffer(GL_SHADER_STORAGE_BUFFER, ssbo_result.handle);
      ptr = (GLfloat *) glMapBuffer(GL_SHADER_STORAGE_BUFFER, GL_WRITE_ONLY);
      memcpy(ptr, result_container.data(), ssbo_result.NUM_PIX * sizeof(float));
      glUnmapBuffer(GL_SHADER_STORAGE_BUFFER);


      g_win.update();
      if (glfwGetKey(g_win.getGLFWwindow(), GLFW_KEY_ESCAPE) == GLFW_PRESS) {
        g_win.stop();
      }
    }
    return 0;
}

初始化ssbo并调用glDispatchCompute()glMemoryBarrier(GL_SHADER_STORAGE_BARRIER_BIT)之后,我读出结果并将其保存在std::vector<float>result_container中。这会像第一次运行时所期望的那样用1.0f填充容器,ssbo_result.handle就像我的out_picture ssbo

然后我尝试将结果作为out_picture的输入反馈回去,就像我通过翻转memcpy dest和source读取数据一样,据我所知,我现在有了我以前的结果在out_picture GPU内存中

如您所见,我正在尝试向out_picture添加一个值(此处为1.0f),并将其作为out_picture的输入反馈给下一次计算。想法是仅将结果添加为下一次运行的输入。 我尝试对glCopyBufferSubData执行相同操作,但结果相同。每次仅输出1.0,而不是1,2,3 ...

1 个答案:

答案 0 :(得分:1)

在启动计算着色器之后,在while循环中 0 绑定到绑定点 0

while (!g_win.shouldClose()) {

    ....
    glDispatchCompute(ssbo_result.NUM_PIX / ssbo_result.WORK_GROUP_SIZE, 1, 1);
    glMemoryBarrier(GL_SHADER_STORAGE_BARRIER_BIT);
    glBindBufferBase(GL_SHADER_STORAGE_BUFFER, 0, 0);
    ....
} 

但是ssbo_result.handle再也不会绑定到绑定点 0 。这导致计算仅在循环的第一个循环中进行,因为与着色器存储缓冲区的绑定在循环的其他循环中被破坏。

打破缓冲区的绑定是完全多余的,因为绑定点不用于其他任何用途。

在循环中删除行glBindBufferBase(GL_SHADER_STORAGE_BUFFER, 0, 0);,以解决此问题。 (当然,在while循环开始时连续绑定缓冲区也可以完成工作-在glBindBufferBase(GL_SHADER_STORAGE_BUFFER, 0, ssbo_result.handle);之前添加glDispatchCompute