使用VBO的OpenGL ES iOS绘图性能比没有VBO要慢得多

时间:2013-03-08 15:42:45

标签: ios performance opengl-es vbo

我最近将当前项目中的绘图从标准绘图从内存数组更改为VBO。令我惊讶的是,帧速率从60fps显着下降到30fps,绘制了1200次8次的模型。进行进一步的分析表明,与使用内存绘制相比,使用VBO时glDrawElements需要10倍的时间。

我真的很困惑为什么会这样。有谁知道可能导致性能下降的原因是什么?

我正在测试运行iOS 6.1.2的iPhone 5。

我将我的VBO处理分离到一个函数中,我在函数顶部静态创建顶点/索引缓冲区。我可以使用#ifdef USE_VBO

在普通和VBO渲染之间切换
- (void)drawDuck:(Toy*)toy reflection:(BOOL)reflection
{
    ModelOBJ* model = _duck[0].model;
    int stride = sizeof(ModelOBJ::Vertex);

#define USE_VBO
#ifdef USE_VBO
    static bool vboInitialized = false;
    static unsigned int vbo, ibo;
    if (!vboInitialized) {
        vboInitialized = true;

        // Generate VBO
        glGenBuffers(1, &vbo);
        int numVertices = model->getNumberOfVertices();
        glBindBuffer(GL_ARRAY_BUFFER, vbo);
        glBufferData(GL_ARRAY_BUFFER, stride*numVertices, model->getVertexBuffer(), GL_STATIC_DRAW);
        glBindBuffer(GL_ARRAY_BUFFER, 0);

        // Generate index buffer
        glGenBuffers(1, &ibo);
        int numIndices = model->getNumberOfIndices();
        glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, ibo);
        glBufferData(GL_ELEMENT_ARRAY_BUFFER, sizeof(unsigned short)*numIndices, model->getIndexBuffer(), GL_STATIC_DRAW);
        glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, 0);
    }
#endif

    [self setupDuck:toy reflection:reflection];


#ifdef USE_VBO
    // Draw with VBO
    glBindBuffer(GL_ARRAY_BUFFER, vbo);
    glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, ibo);

    glEnableVertexAttribArray(GC_SHADER_ATTRIB_POSITION);
    glEnableVertexAttribArray(GC_SHADER_ATTRIB_NORMAL);
    glEnableVertexAttribArray(GC_SHADER_ATTRIB_TEX_COORD);

    glVertexAttribPointer(GC_SHADER_ATTRIB_POSITION, 3, GL_FLOAT, GL_FALSE, stride, (void*)offsetof(ModelOBJ::Vertex, position));
    glVertexAttribPointer(GC_SHADER_ATTRIB_TEX_COORD, 2, GL_FLOAT, GL_FALSE, stride, (void*)offsetof(ModelOBJ::Vertex, texCoord));
    glVertexAttribPointer(GC_SHADER_ATTRIB_NORMAL, 3, GL_FLOAT, GL_FALSE, stride, (void*)offsetof(ModelOBJ::Vertex, normal));
    glDrawElements(GL_TRIANGLES, model->getNumberOfIndices(), GL_UNSIGNED_SHORT, 0);

    glBindBuffer(GL_ARRAY_BUFFER, 0);
    glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, 0);
#else
    // Draw with array
    glEnableVertexAttribArray(GC_SHADER_ATTRIB_POSITION);
    glEnableVertexAttribArray(GC_SHADER_ATTRIB_NORMAL);
    glEnableVertexAttribArray(GC_SHADER_ATTRIB_TEX_COORD);

    glVertexAttribPointer(GC_SHADER_ATTRIB_POSITION, 3, GL_FLOAT, GL_FALSE, stride, model->getVertexBuffer()->position);
    glVertexAttribPointer(GC_SHADER_ATTRIB_TEX_COORD, 2, GL_FLOAT, GL_FALSE, stride, model->getVertexBuffer()->texCoord);
    glVertexAttribPointer(GC_SHADER_ATTRIB_NORMAL, 3, GL_FLOAT, GL_FALSE, stride, model->getVertexBuffer()->normal);
    glDrawElements(GL_TRIANGLES, model->getNumberOfIndices(), GL_UNSIGNED_SHORT, model->getIndexBuffer());
#endif
}

ModelOBJ :: Vertex对于pos,texcoord,normal只有3,2,3个浮点数。指数很快。

UPDATE:我现在已经将绘图设置(即attrib绑定调用)包装到VAO中,现在性能还可以,甚至比从主内存中绘图要好一些。所以我的结论是,没有VAO的VBO支持在iOS上被破坏了。这个假设是否正确?

2 个答案:

答案 0 :(得分:8)

驱动程序可能会回退到软件顶点提交(从VBO到命令缓冲区的CPU复制)。这可能比在客户端内存中使用顶点数组更糟糕,因为我们通常会缓存客户端内存,而VBO内容通常在iOS上的写入组合内存中。

在仪器中使用CPU采样器时,如果gleRunVertexSubmitARM中的glDrawArrays / glDrawElements下面有时间,你会看到很多。

回退到SW CPU提交的最常见原因是未对齐属性(当前iOS设备要求每个属性对齐4字节),但对于您显示的3个属性,情况似乎并非如此。之后,下一个最常见的原因是在单个顶点数组配置中混合客户端数组和缓冲区对象。

在这种情况下,您可能有一个杂散顶点属性绑定:某些其他数组元素可能仍然启用并指向客户端数组,导致所有内容都脱离硬件DMA路径。通过创建VAO,您可以从错误配置的默认VAO切换,或者您尝试启用客户端VAO但是因为客户端阵列已折旧而无法运行,并且在与VAO一起使用时不起作用(而是抛出INVALID_OPERATION错误)

答案 1 :(得分:1)

使用glBufferData填充索引缓冲区时,第二个参数应为2*numIndices而不是stride*numIndices

由于您的索引缓冲区比它需要的大得多,这可以解释您的性能问题。