我正在寻找优化以下glsl函数来执行cubmap面选择。它需要一个3分量矢量并返回面部,面部的texcoords和最大的组件。
vec4 cubemap( vec3 P )
{
vec4 Coord;
vec3 s = abs(P.xyz);
bvec3 b = greaterThan( P.xyz, vec3(0,0,0) );
if ( all( greaterThanEqual( s.xx, s.yz ) ) )
{
if ( b.x )
Coord = vec4( -P.z, -P.y, 0, s.x );
else
Coord = vec4( P.z, -P.y, 1, s.x );
} else
if ( all( greaterThanEqual( s.yy, s.xz ) ) )
{
if ( b.y )
Coord = vec4( P.x, P.z, 2, s.y );
else
Coord = vec4( P.x, -P.z, 3, s.y );
} else
{
if ( b.z )
Coord = vec4( P.x, -P.y, 4, s.z );
else
Coord = vec4( -P.x, -P.y, 5, s.z );
}
Coord.xy = ((Coord.xy / Coord.w) + 1.0) * 0.5;
return Coord;
}
答案 0 :(得分:2)
这种方式可能仍然很慢,但它没有做任何分支:
vec2 directionToUV(vec3 v) {
vec3 abs = abs(v);
float max = max(max(abs.x, abs.y), abs.z); // Get the largest component
vec3 weights = step(max, abs); // 1.0 for the largest component, 0.0 for the others
float sign = dot(weights, sign(v)) * 0.5 + 0.5; // 0 or 1
// Find the uv coordinate
float sc = dot(weights, mix(vec3(v.z, v.x, -v.x), vec3(-v.z, v.x, v.x), sign));
float tc = dot(weights, mix(vec3(-v.y, -v.z, -v.y), vec3(-v.y, v.z, -v.y), sign));
vec2 uv = (vec2(sc, tc) / max) * 0.5 + 0.5;
// Offset into the right region of the texture
float offsetX = dot(weights, vec3(0.0, 1.0, 2.0));
float offsetY = sign;
uv.x = (uv.x + offsetX) / 3.0;
uv.y = (uv.y + offsetY) / 2.0;
return uv;
}
立方体贴图的排列方式如
+----+----+----+
| x | y | z |
+----+----+----+
| -x | -y | -z |
+----+----+----+
答案 1 :(得分:0)
您可以优化动态分支。我不确定这是否会提高性能,但在这种情况下你肯定可以尝试一下。它有时可以提高着色器代码的性能。
例如,对于第一个条件,您可以/尝试/类似:
int condition=(s.x>=s.y)*(s.x>=s.z)*(b.x);
Coord = condition*vec4( (1.-2.*condition)*P.z, -P.y, condition, s.x );
等等...我想这会给你带来某种性能提升,如果只是边际,因为据我所知,GPU上的动态分支在高度发散时很昂贵,通常只能用于有条件地消除更大的块的运作。
这是我看到的最明显的事情。