OpenGl DisplayList速度较慢

时间:2012-11-12 06:51:45

标签: performance opengl displaylist

我有问题:
我必须输出一个15x15元素的游戏区 最重要的是,我在游戏循环中调用了我的函数“printFloor()”。

这个函数遍历所有225个元素,并根据它们的值显示我的纹理文件的不同部分。因此,CPU必须在每个循环周期中呈现相同的225个纹理。 游戏循环每个周期需要大约16-32ms,所以我现在把这个输出放在显示列表中:

if(!gamefloorPrepared)  //no Display list created -> this is the first time the floor nees to
                        //be printed
{   gamefloor = glGenLists(1);

    glNewList(gamefloor,GL_COMPILE);
        for(int y=0;y<size.y;y++)
        {   for(int x=0;x<size.x;x++)
            {   printFloorElement(spielfeld[y][x],{x,y});     //see below
            }
        }
    glEndList();
    gamefloorPrepared=1;
}else
{   glCallList(gamefloor);

}

函数printFloorElement计算位置,将图形模式更改为“switchGraphicMode(TEXTURES);”,绑定纹理并绘制纹理:

glBegin(GL_QUADS);
    glTexCoord2f(spriteSize.x* spritePos.x   +halfTexelSize.x,spriteSize.y*(spritePos.y+1)-halfTexelSize.y);   glVertex2f(display.a.x,display.a.y);
    glTexCoord2f(spriteSize.x* spritePos.x   +halfTexelSize.x,spriteSize.y* spritePos.y   +halfTexelSize.y);   glVertex2f(display.a.x,display.b.y);
    glTexCoord2f(spriteSize.x*(spritePos.x+1)-halfTexelSize.x,spriteSize.y* spritePos.y   +halfTexelSize.y);   glVertex2f(display.b.x,display.b.y);
    glTexCoord2f(spriteSize.x*(spritePos.x+1)-halfTexelSize.x,spriteSize.y*(spritePos.y+1)-halfTexelSize.y);   glVertex2f(display.b.x,display.a.y);
glEnd();

问题:一个游戏循环周期现在需要60-80毫秒,所以它相当慢。 显示列表只生成一次,我已经检查过了。

“switchGraphicMode()” - 功能:

void switchGraphicMode(GRAPHICMODES target)//can be "TEXTURES" or "DRAWING"
{    if(target != graphicMode)//"gaphicMode" = global Variable which shows if GL_TEXTURE_2D is currently enabled
    {   if(target==DRAWING)
        {   glDisable(GL_TEXTURE_2D);
            graphicMode=DRAWING;
        }else
        {   glEnable(GL_TEXTURE_2D);
            graphicMode=TEXTURES;
        }
    }
}

有人知道原因吗?

2 个答案:

答案 0 :(得分:2)

glBegin()/ glEnd()和displaylists是不推荐使用的“立即模式”管道的一部分。

现在首选的方法是使用顶点缓冲区对象。

这两种方法的区别在于,在立即模式下,每次通过渲染循环,即使使用显示列表,也会将顶点数据从主机内存传输到GPU(显示列表在主机上保留,不是显示卡。)

顶点缓冲区对象是在显示卡的内存中维护的内存缓冲区。您将其设置一次,然后在开始渲染之前一次性传输顶点数据。然后每次通过渲染循环,调用专门的绘图函数,告诉显卡使用该缓冲区中的数据进行绘制,从而避免执行昂贵的主机来显示卡片数据传输。

使用顶点缓冲区对象需要比立即模式渲染更多的设置,但加速是非常值得的。谷歌opengl顶点缓冲对象。应该有大量的教程和示例代码来帮助您入门。

答案 1 :(得分:0)

很难说这些代码片段,但是第一步我建议你在填充DisplayList时利用批处理,这似乎是你错过了:

glEnable(GL_TEXTURE_2D);

if(!gamefloorPrepared)
{   gamefloor = glGenLists(1);

    glNewList(gamefloor,GL_COMPILE);
    glBegin(GL_QUADS);
        for(int y=0;y<size.y;y++)
        {   for(int x=0;x<size.x;x++)
            {   
                glTexCoord2f(spriteSize.x* spritePos.x   +halfTexelSize.x,spriteSize.y*(spritePos.y+1)-halfTexelSize.y);   glVertex2f(display.a.x,display.a.y);
                glTexCoord2f(spriteSize.x* spritePos.x   +halfTexelSize.x,spriteSize.y* spritePos.y   +halfTexelSize.y);   glVertex2f(display.a.x,display.b.y);
                glTexCoord2f(spriteSize.x*(spritePos.x+1)-halfTexelSize.x,spriteSize.y* spritePos.y   +halfTexelSize.y);   glVertex2f(display.b.x,display.b.y);
                glTexCoord2f(spriteSize.x*(spritePos.x+1)-halfTexelSize.x,spriteSize.y*(spritePos.y+1)-halfTexelSize.y);   glVertex2f(display.b.x,display.a.y);
            }
        }
    glEnd();
    glEndList();
    gamefloorPrepared=1;
}else
{  
 glCallList(gamefloor);    
}
glDisable(GL_TEXTURE_2D);

这样,显示列表中的所有顶点都在一个GL_QUADS子句内,并且没有不必要的texture_2d状态更改。

P.S。有人应该添加关于已弃用功能的评论;)