GLSL着色器生成法线

时间:2009-12-26 20:38:44

标签: optimization glsl

您好我正在编写3D建模应用程序,我想加快OpenGL中的渲染速度。目前我使用glBegin / glEnd这是非常慢和不赞成的方式。我需要绘制非常快速的平面阴影模型。我每帧都在CPU上生成法线。这很慢。我尝试将glDrawElements与索引几何一起使用,但是在正常生成中存在问题,因为法线在顶点处指定而不是在三角形级别。
另一个想法是使用GLSL在几何着色器中在GPU上生成法线。我为正常生成编写了这段代码:

#version 120 
#extension GL_EXT_geometry_shader4 : enable

vec3 NormalFromTriangleVertices(vec3 triangleVertices[3])
{
    // now is same as RedBook (OpenGL Programming Guide)
    vec3 u = triangleVertices[0] - triangleVertices[1];
    vec3 v = triangleVertices[1] - triangleVertices[2];
    return cross(v, u);
}

void main()
{
    // no change of position
    // computes normal from input triangle and front color for that triangle

    vec3 triangleVertices[3];
    vec3 computedNormal;

    vec3 normal, lightDir;
    vec4 diffuse;
    float NdotL;

    vec4 finalColor;

    for(int i = 0; i < gl_VerticesIn; i += 3)
    {
        for (int j = 0; j < 3; j++)
        {
            triangleVertices[j] = gl_PositionIn[i + j].xyz;
        }
        computedNormal = NormalFromTriangleVertices(triangleVertices);
        normal = normalize(gl_NormalMatrix * computedNormal);

        // hardcoded light direction 
        vec4 light = gl_ModelViewMatrix * vec4(0.0, 0.0, 1.0, 0.0);
        lightDir = normalize(light.xyz);

        NdotL = max(dot(normal, lightDir), 0.0);

        // hardcoded
        diffuse = vec4(0.5, 0.5, 0.9, 1.0);

        finalColor = NdotL * diffuse; 
        finalColor.a = 1.0; // final color ignores everything, except lighting

        for (int j = 0; j < 3; j++)
        { 
            gl_FrontColor = finalColor;
            gl_Position = gl_PositionIn[i + j];
            EmitVertex();
        }
    }
    EndPrimitive();
}

当我将着色器集成到我的应用程序时,没有出现速度提升。它比以前更糟糕。我是GLSL的新手和整体着色器,所以我不知道我做错了什么。 我在MacBook上使用Geforce 9400M尝试了这个代码。

更清楚的是,这是我要替换的代码:

- (void)drawAsCommandsWithScale:(Vector3D)scale
{
    float frontDiffuse[4] = { 0.4, 0.4, 0.4, 1 };
    CGFloat components[4];
    [color getComponents:components];
    float backDiffuse[4];
    float selectedDiffuse[4] = { 1.0f, 0.0f, 0.0f, 1 };

    for (uint i = 0; i < 4; i++)
        backDiffuse[i] = components[i];

    glMaterialfv(GL_BACK, GL_DIFFUSE, backDiffuse);
    glMaterialfv(GL_FRONT, GL_DIFFUSE, frontDiffuse);

    Vector3D triangleVertices[3];

    float *lastDiffuse = frontDiffuse; 

    BOOL flip = scale.x < 0.0f || scale.y < 0.0f || scale.z < 0.0f;

    glBegin(GL_TRIANGLES);

    for (uint i = 0; i < triangles->size(); i++)
    {
        if (selectionMode == MeshSelectionModeTriangles) 
        {
            if (selected->at(i))
            {
                if (lastDiffuse == frontDiffuse)
                {
                    glMaterialfv(GL_FRONT_AND_BACK, GL_DIFFUSE, selectedDiffuse);
                    lastDiffuse = selectedDiffuse;
                }
            }
            else if (lastDiffuse == selectedDiffuse)
            {
                glMaterialfv(GL_BACK, GL_DIFFUSE, backDiffuse);
                glMaterialfv(GL_FRONT, GL_DIFFUSE, frontDiffuse);
                lastDiffuse = frontDiffuse;
            }
        }    
        Triangle currentTriangle = [self triangleAtIndex:i];
        if (flip)
            currentTriangle = FlipTriangle(currentTriangle);

        [self getTriangleVertices:triangleVertices fromTriangle:currentTriangle];
        for (uint j = 0; j < 3; j++)
        {
            for (uint k = 0; k < 3; k++)
            {
                triangleVertices[j][k] *= scale[k];
            }
        }
        Vector3D n = NormalFromTriangleVertices(triangleVertices);
        n.Normalize();
        for (uint j = 0; j < 3; j++)
        {
            glNormal3f(n.x, n.y, n.z);
            glVertex3f(triangleVertices[j].x, triangleVertices[j].y, triangleVertices[j].z);            
        }
    }

    glEnd();    
}

正如您所看到的那样效率非常低,但正在工作。trianglesvertices数组的索引数组。

我尝试使用此代码进行绘制,但我不能只有一个索引数组而不是两个(一个用于顶点,第二个用于法线)。

glEnableClientState(GL_VERTEX_ARRAY);

uint *trianglePtr = (uint *)(&(*triangles)[0]); 
float *vertexPtr = (float *)(&(*vertices)[0]);

glVertexPointer(3, GL_FLOAT, 0, vertexPtr);
glDrawElements(GL_TRIANGLES, triangles->size() * 3, GL_UNSIGNED_INT, trianglePtr);
glDisableClientState(GL_VERTEX_ARRAY);

现在,当一些顶点由不同的三角形共享时,我如何指定法线指针,为它们设置不同的法线?

3 个答案:

答案 0 :(得分:2)

所以我终于设法提高了渲染速度。我只在顶点或三角形发生变化时重新计算CPU上的法线,这只有在一个网格中而不是在整个场景中工作时才会发生。 这不是我想要的解决方案,但在现实世界中它比以前的方法更好 我将整个几何体缓存到单独的法线和顶点阵列中,不能使用索引图,因为我想要平面着色(类似于3ds max中平滑组的问题)。
我使用简单的glDrawArrays和照明顶点着色器,这是因为我想要在三角形模式下选择三角形的颜色不同,另一个未选择,并且没有材料数组(我没有找到任何一个)。

答案 1 :(得分:1)

通常情况下,只有在几何体发生变化时,才会计算每帧的法线。 并且为每个三角形设置一个法线,只为三角形中的每个顶点设置相同的法线。这意味着您不能在网格中的相邻三角形之间共享顶点,但这种情况并不罕见。

答案 2 :(得分:1)

您的问题让我记住了这篇Normals without Normals博文。