我遇到了与新计算着色器相关的问题。我目前正在研究粒子系统。我将所有粒子存储在着色器存储缓冲区中,以便在计算着色器中访问它们。然后我派遣一个一维工作组。
#define WORK_GROUP_SIZE 128
_shaderManager->useProgram("computeProg");
glDispatchCompute((_numParticles/WORK_GROUP_SIZE), 1, 1);
glMemoryBarrier(GL_SHADER_STORAGE_BARRIER_BIT);
我的计算着色器:
#version 430
struct particle{
vec4 currentPos;
vec4 oldPos;
};
layout(std430, binding=0) buffer particles{
struct particle p[];
};
layout (local_size_x = 128, local_size_y = 1, local_size_z = 1) in;
void main(){
uint gid = gl_GlobalInvocationID.x;
p[gid].currentPos.x += 100;
}
但不知何故并非所有粒子都受到影响。我这样做就像在这个例子中一样,但它不起作用。 http://education.siggraph.org/media/conference/S2012_Materials/ComputeShader_6pp.pdf
编辑:
在我调用glMemoryBarrier(GL_SHADER_STORAGE_BARRIER_BIT)后,我继续这样:
_shaderManager->useProgram("shaderProg");
glBindBuffer(GL_ARRAY_BUFFER, shaderStorageBufferID);
glVertexPointer(4,GL_FLOAT,sizeof(glm::vec4), (void*)0);
glEnableClientState(GL_VERTEX_ARRAY);
glDrawArrays(GL_POINTS, 0, _numParticles);
glDisableClientState(GL_VERTEX_ARRAY);
那么在这种情况下哪个位适合使用?
答案 0 :(得分:8)
你有barriers on backwards。这是一个常见的问题。
您为屏障提供的位描述了您打算如何使用写入的数据,而不是如何编写数据。 GL_SHADER_STORAGE_BARRIER_BIT
仅适用于通过图像加载/存储(或存储缓冲区/原子计数器)写入缓冲区对象的进程,然后使用存储缓冲区读取缓冲区对象数据。
由于您正在将缓冲区作为顶点属性数组缓冲区进行读取,因此您应该使用巧妙标题为GL_VERTEX_ATTRIB_ARRAY_BARRIER_BIT
。
答案 1 :(得分:1)
我解决了这个问题。问题只是我派出的工作组数量。 numParticles / WORK_GROUP_SIZE将四舍五入,因为两个变量都是整数。这导致派遣的工作组数量太少,粒子数量不同。
当我获得1000个粒子时,则仅调度1000/128 = 7个工作组。每个工作组的大小为128.这意味着我得到7 * 128 = 896个线程,因此104个粒子根本不会移动。 由于numParticles%128的范围可以是0 ... 128,因此我只派出了一个工作组:
glDispatchCompute((_numParticles/WORK_GROUP_SIZE)+1, 1, 1);
从现在开始,每个粒子都会移动。 :)