我正在使用OpenGL 4和C ++ 11。
目前,我使用单独的VO与单独的VBO和IBO对glDrawElements
进行了大量的单独调用。
我这样做是因为每个纹理坐标都会发生变化,而我的Vertex数据会显示纹理坐标。我知道这个顶点数据中有一些重要的位置信息;然而,它总是-1,-1,1,1因为我在顶点着色器中使用平移和缩放矩阵来定位和缩放顶点数据。
VAO,VBO,IBO,位置和比例矩阵以及纹理ID存储在对象中。它是每个四边形的一个对象。
目前,有些绘图会像这样出现:
glDrawElements(GL_TRIANGLES, 6, GL_UNSIGNED_INT,0)
)绘制四元对象。绑定的VBO只有-1,-1,1,1而IBO给我一个四边形。绑定的VBO包含共同纹理的纹理坐标(用于纹理所有绘制的四边形的相同纹理)。着色器上的矩阵变换定位它。glEnable(GL_SCISSOR_TEST)
被调用,预览四元组的位置信息用于调用glScissor
我现在所获得的表现是可以接受的,但我希望它更快,因为我只是触及了我的想法。所以我正在考虑优化。到目前为止,我已经读到了我应该:
从我的顶点数据中删除位置信息,只保留纹理坐标。而是在绘制四边形的开始处绑定单个位置VBO,以便它们被所有它们使用。
但是我不确定这会怎么样?因为我一次只能激活一个VBO。
我是否必须在绘制每个四边形之前调用glBufferSubData
并更新纹理坐标?这会有更好的表现还是更差(为每个对象调用glBindVertexArray
或调用glBufferSubData
?)
我是否仍然将位置和比例作为矩阵传递给着色器,我是否也借此机会更新顶点的位置信息以及纹理坐标?哪个会更快?
使用或不使用IBO创建一个大的VBO,并更新每个四元组中位置的顶点数据(而不是使用变换和缩放矩阵)。这似乎很难管理。
即使我确实设法做到了这一点;我只有一个glDraw
电话;听起来很快。这是真的?单个glBindVertexArray
呼叫对多个呼叫有什么样的性能影响?
我认为没有办法使用这种方法来实现我现在正在进行的glScissor
调用?
我读过的另一个选择是实例化。所以我画了四边形但是我需要它多次;这意味着我会通过着色器传递一系列平移矩阵和一系列纹理坐标?
这会更快吗?
我想我可以通过传递一个额外的布尔数组来做类似glScissor
测试的事情,这些布尔值定义了当前的四边形是否应该只在前一个边界内绘制。但是,我认为这意味着对于每个gl_InstanceID
,我必须遍历所有先前的实例,寻找真值和假值,而且看起来它会很慢。
我试图通过不单独实施所有这些来节省时间。希望专家可以指出哪个可能更好。如果有人有更好的想法,请告诉我。
答案 0 :(得分:1)
以下序列将2个vbos绑定到属性0& 1,请注意glBindBuffer()暂时绑定缓冲区,并且在glVertexAttribPointer()期间对attrib进行实际VBO赋值。
glBindBuffer(GL_ARRAY_BUFFER,buf1);
glVertexAttribPointer(0, ...);
glEnableVertexAttribArray(0);
glBindBuffer(GL_ARRAY_BUFFER,buf2);
glVertexAttribPointer(1, ...);
glEnableVertexAttribArray(1);
提供四合一位置的最快方法sizes是使用纹理并在顶点着色器中对其进行采样。当然,您至少需要RGBA(x,y,宽度,高度)16位/通道纹理。但是你可以使用glTexSubImage2D()更新quad位置,或者甚至可以通过FBO渲染它们。
除此之外的所有内容都会变慢,当然如果您希望我们可以详细说明使用制服,在vbos中使用attribs或使用没有启用数组的attribs。
全部放在一起: