Question

我正在寻找优化以下glsl函数来执行cubmap面选择。它需要一个3分量矢量并返回面部，面部的texcoords和最大的组件。

vec4 cubemap( vec3 P )
{
    vec4 Coord;
    vec3    s = abs(P.xyz);
    bvec3   b = greaterThan( P.xyz, vec3(0,0,0) );

    if ( all( greaterThanEqual( s.xx, s.yz ) ) )
    {
        if ( b.x )
            Coord = vec4( -P.z, -P.y, 0, s.x );
        else
            Coord = vec4(  P.z, -P.y, 1, s.x );
    } else 
    if ( all( greaterThanEqual( s.yy, s.xz ) ) )
    {
        if ( b.y )
            Coord = vec4(  P.x,  P.z, 2, s.y );
        else
            Coord = vec4(  P.x, -P.z, 3, s.y );
    } else 
    {
        if ( b.z )
            Coord = vec4(  P.x, -P.y, 4, s.z );
        else
            Coord = vec4( -P.x, -P.y, 5, s.z );
    }

    Coord.xy = ((Coord.xy / Coord.w) + 1.0) * 0.5;
    return Coord;
}

Answer 1

这种方式可能仍然很慢，但它没有做任何分支：

vec2 directionToUV(vec3 v) {
    vec3 abs = abs(v);
    float max = max(max(abs.x, abs.y), abs.z); // Get the largest component
    vec3 weights = step(max, abs); // 1.0 for the largest component, 0.0 for the others
    float sign = dot(weights, sign(v)) * 0.5 + 0.5; // 0 or 1

    // Find the uv coordinate 
    float sc = dot(weights, mix(vec3(v.z, v.x, -v.x), vec3(-v.z, v.x, v.x), sign));
    float tc = dot(weights, mix(vec3(-v.y, -v.z, -v.y), vec3(-v.y, v.z, -v.y), sign));
    vec2 uv = (vec2(sc, tc) / max) * 0.5 + 0.5;

    // Offset into the right region of the texture
    float offsetX = dot(weights, vec3(0.0, 1.0, 2.0));
    float offsetY = sign;
    uv.x = (uv.x + offsetX) / 3.0;
    uv.y = (uv.y + offsetY) / 2.0;
    return uv;
}

立方体贴图的排列方式如

        +----+----+----+
        |  x |  y |  z |
        +----+----+----+
        | -x | -y | -z |
        +----+----+----+

Answer 2

您可以优化动态分支。我不确定这是否会提高性能，但在这种情况下你肯定可以尝试一下。它有时可以提高着色器代码的性能。

例如，对于第一个条件，您可以/尝试/类似：

int condition=(s.x>=s.y)*(s.x>=s.z)*(b.x);
Coord = condition*vec4( (1.-2.*condition)*P.z, -P.y, condition, s.x );

等等...我想这会给你带来某种性能提升，如果只是边际，因为据我所知，GPU上的动态分支在高度发散时很昂贵，通常只能用于有条件地消除更大的块的运作。

这是我看到的最明显的事情。

在GLSL中选择cubmap face的快捷方法

2 个答案: