我正在尝试在Compute Shader上进行简单的计算,在经过一轮计算后,我将该轮的结果返回给Shader作为第二轮的输入。
我的Compute着色器如下所示:
#version 440 core
layout(std430, binding = 0) buffer Result{
float out_picture[];
};
layout(std430, binding = 1) buffer In_p1{
float in_p1[];
};
layout(local_size_x = 1000) in;
void main() {
in_p1[gl_GlobalInvocationID.x] = 1.0f;
out_picture[gl_GlobalInvocationID.x] = out_picture[gl_GlobalInvocationID.x] + in_p1[gl_GlobalInvocationID.x];
}
她是我的OpenGL代码:
int main(int argc, char* argv[]) {
std::vector<float> result_container;
std::vector<SSBO> ssbo_container;
SSBO ssbo_result;
ssbo_result.NUM_PIX = 1920*1080*4;
ssbo_result.WORK_GROUP_SIZE = 1000;
result_container.reserve(ssbo_result.NUM_PIX * sizeof(float));
glGenBuffers(1, &ssbo_result.handle);
glBindBufferBase(GL_SHADER_STORAGE_BUFFER, 0, ssbo_result.handle);
glBufferData(GL_SHADER_STORAGE_BUFFER, ssbo_result.NUM_PIX * sizeof(float), NULL, GL_DYNAMIC_DRAW);
for(unsigned int i = 1; i < 2; i++){
SSBO ssbo;
glGenBuffers(1, &ssbo.handle);
glBindBufferBase(GL_SHADER_STORAGE_BUFFER, i, ssbo.handle);
glBufferData(GL_SHADER_STORAGE_BUFFER, ssbo_result.NUM_PIX * sizeof(float), NULL, GL_DYNAMIC_DRAW);
ssbo_container.push_back(ssbo);
}
while (!g_win.shouldClose()) {
std::cout << "container:" << result_container[0] << std::endl;
glUseProgram(g_avg_program);
glDispatchCompute(ssbo_result.NUM_PIX / ssbo_result.WORK_GROUP_SIZE, 1, 1);
glMemoryBarrier(GL_SHADER_STORAGE_BARRIER_BIT);
glBindBufferBase(GL_SHADER_STORAGE_BUFFER, 0, 0);
glBindBuffer(GL_SHADER_STORAGE_BUFFER, ssbo_result.handle);
GLfloat *ptr = (GLfloat *) glMapBuffer(GL_SHADER_STORAGE_BUFFER, GL_READ_ONLY);
memcpy(result_container.data(), ptr, ssbo_result.NUM_PIX * sizeof(float));
glUnmapBuffer(GL_SHADER_STORAGE_BUFFER);
glBindBuffer(GL_SHADER_STORAGE_BUFFER, ssbo_result.handle);
ptr = (GLfloat *) glMapBuffer(GL_SHADER_STORAGE_BUFFER, GL_WRITE_ONLY);
memcpy(ptr, result_container.data(), ssbo_result.NUM_PIX * sizeof(float));
glUnmapBuffer(GL_SHADER_STORAGE_BUFFER);
g_win.update();
if (glfwGetKey(g_win.getGLFWwindow(), GLFW_KEY_ESCAPE) == GLFW_PRESS) {
g_win.stop();
}
}
return 0;
}
初始化ssbo并调用glDispatchCompute()
和glMemoryBarrier(GL_SHADER_STORAGE_BARRIER_BIT)
之后,我读出结果并将其保存在std::vector<float>result_container
中。这会像第一次运行时所期望的那样用1.0f填充容器,ssbo_result.handle
就像我的out_picture
ssbo
然后我尝试将结果作为out_picture
的输入反馈回去,就像我通过翻转memcpy dest和source读取数据一样,据我所知,我现在有了我以前的结果在out_picture
GPU内存中
如您所见,我正在尝试向out_picture
添加一个值(此处为1.0f),并将其作为out_picture
的输入反馈给下一次计算。想法是仅将结果添加为下一次运行的输入。
我尝试对glCopyBufferSubData
执行相同操作,但结果相同。每次仅输出1.0,而不是1,2,3 ...
答案 0 :(得分:1)
在启动计算着色器之后,在while循环中 0 绑定到绑定点 0 :
while (!g_win.shouldClose()) {
....
glDispatchCompute(ssbo_result.NUM_PIX / ssbo_result.WORK_GROUP_SIZE, 1, 1);
glMemoryBarrier(GL_SHADER_STORAGE_BARRIER_BIT);
glBindBufferBase(GL_SHADER_STORAGE_BUFFER, 0, 0);
....
}
但是ssbo_result.handle
再也不会绑定到绑定点 0 。这导致计算仅在循环的第一个循环中进行,因为与着色器存储缓冲区的绑定在循环的其他循环中被破坏。
打破缓冲区的绑定是完全多余的,因为绑定点不用于其他任何用途。
在循环中删除行glBindBufferBase(GL_SHADER_STORAGE_BUFFER, 0, 0);
,以解决此问题。 (当然,在while
循环开始时连续绑定缓冲区也可以完成工作-在glBindBufferBase(GL_SHADER_STORAGE_BUFFER, 0, ssbo_result.handle);
之前添加glDispatchCompute
)