C#XNA 4.0帧速率问题,可能.GetData误用

时间:2013-06-14 19:01:51

标签: c# 3d xna xna-4.0 terrain

在尝试进行实时3D地形变化时,我遇到了帧速率下降的问题。我使用的是C#,XNA 4.0和VS 2010.这是我的旧学校项目,现在是完成它的时候了。

我已经从图像文件生成地形,包含所有效果和内容,无论图像文件的分辨率如何,它都能顺利运行。问题出在我的地形编辑器上。我希望它能够手动改变地形。我也做了那个部分,但只有在地形大小相等或小于128x128像素时它才有效。如果地形大小更大,我开始将帧速率降低到大约150x150像素,如果地形大小大于512x512像素,则完全无法管理。

我已经尝试了几种方法:

  • 试图使用线程,但后来我得到奇怪的错误,说“一次一个线程中可以调用Draw方法”或类似的东西,而且我无法解决。

    < / LI>
  • 接下来我尝试使用DynamicVertexBuffer和DynamicIndexBuffer。这有很大帮助,现在我的代码可以使用可接受的帧速率,最大可达256x256像素。

看看我的代码:

    public void ChangeTerrain(float[,] heightData)
    {
        int x, y;
        int v = 1;
        if (currentMouseState.LeftButton == ButtonState.Pressed && currentMouseState.X < 512)
        {
            x = (int)currentMouseState.X / 2;
            y = (int)currentMouseState.Y / 2;
            if (x < 5)
                x = 5;
            if (x >= 251)
                x = 251;
            if (y < 5)
                y = 5;
            if (y >= 251)
                y = 251;

            for (int i = x - 4; i < x + 4; i++)
            {
                for (int j = y - 4; j < y + 4; j++)
                {
                    if (i == x - 4 || i == x + 3 || j == y - 4 || j == y + 3)
                        v = 3;
                    else
                        v = 5;
                    if (heightData[i, j] < 210)
                    {
                        heightData[i, j] += v;
                    }
                }
            }
        }
        if (currentMouseState.RightButton == ButtonState.Pressed && currentMouseState.X < 512)
        {
            x = (int)currentMouseState.X / 2;
            y = (int)currentMouseState.Y / 2;
            if (x < 5)
                x = 5;
            if (x >= 251)
                x = 251;
            if (y < 5)
                y = 5;
            if (y >= 251)
                y = 251;

            for (int i = x - 4; i < x + 4; i++)
            {
                for (int j = y - 4; j < y + 4; j++)
                {
                    if (heightData[i, j] > 0)
                    {
                        heightData[i, j] -= 1;
                    }
                }
            }
        }
        if (keyState.IsKeyDown(Keys.R))
        {
            for (int i = 0; i < 256; i++)
                for (int j = 0; j < 256; j++)
                    heightData[i, j] = 0f;
        }
        SetUpTerrainVertices();
        CalculateNormals();
        terrainVertexBuffer.SetData(vertices, 0, vertices.Length);
    }

我的分辨率为1024x512像素,因此我将鼠标位置缩放1/2以获得地形位置。我使用鼠标左键和右键来改变地形,即改变生成3D地形的heightData。 最后3行从新的heightData创建顶点,计算法线以便可以应用阴影,最后一行只是将顶点数据投射到顶点缓冲区。

在此之前,我在LoadContent方法中设置了动态顶点和索引缓冲区,并调用初始顶点和索引设置。从Update方法调用此方法(ChangeTerrain)。

我做了一些调试,发现最极端情况下最大的顶点大小约为260000 + - 几千。是否有可能.SetData是如此耗时,导致帧速率下降?或者是别的什么?如何解决这个问题并让我的编辑器在任何地形尺寸下都能正常运行?

此外,我需要将此代码与DynamicVertexBuffer一起使用,但我无法在XNA 4.0中使用它。

terrainVertexBuffer.ContentLost += new EventHandler(TerrainVertexBufferContentLost);

public void TerrainVertexBufferContentLost()
{
terrainVertexBuffer(vertices, 0, vertices.Length, SetDataOptions.NoOverwrite);
}

感谢您的帮助!

编辑:

这是我的SetUpTerrainVertices代码:

private void SetUpTerrainVertices()
        {
            vertices = new VertexPositionNormalColored[terrainWidth * terrainLength];

            for (int x = 0; x < terrainWidth; x++)
            {
                for (int y = 0; y < terrainLength; y++)
                {
                    vertices[x + y * terrainWidth].Position = new Vector3(x, heightData[x, y], -y);
vertices[x + y * terrainWidth].Color =  Color.Gray;

                }
            }
        }

我的CalculateNormals

private void CalculateNormals()
        {
            for (int i = 0; i < vertices.Length; i++)
                vertices[i].Normal = new Vector3(0, 0, 0);

            for (int i = 0; i < indices.Length / 3; i++)
            {
                int index1 = indices[i * 3];
                int index2 = indices[i * 3 + 1];
                int index3 = indices[i * 3 + 2];

                Vector3 side1 = vertices[index1].Position - vertices[index3].Position;
                Vector3 side2 = vertices[index1].Position - vertices[index2].Position;
                Vector3 normal = Vector3.Cross(side1, side2);

                vertices[index1].Normal += normal;
                vertices[index2].Normal += normal;
                vertices[index3].Normal += normal;
            }

            for (int i = 0; i < vertices.Length; i++)
                vertices[i].Normal.Normalize();
        }

我使用以下行在XNA LoadContent方法中设置顶点和索引缓冲区:

terrainVertexBuffer = new DynamicVertexBuffer(device, VertexPositionNormalColored.VertexDeclaration, vertices.Length,
                BufferUsage.None);

terrainIndexBuffer = new DynamicIndexBuffer(device, typeof(int), indices.Length, BufferUsage.None);

我从Update调用ChangeTerrain方法,这就是我绘制的方式:

private void DrawTerrain(Matrix currentViewMatrix)
        {
            device.DepthStencilState = DepthStencilState.Default;
            device.Clear(ClearOptions.Target | ClearOptions.DepthBuffer, Color.Black, 1.0f, 0);
            effect.CurrentTechnique = effect.Techniques["Colored"];
            Matrix worldMatrix = Matrix.Identity;
            effect.Parameters["xWorld"].SetValue(worldMatrix);
            effect.Parameters["xView"].SetValue(currentViewMatrix);
            effect.Parameters["xProjection"].SetValue(projectionMatrix);
            effect.Parameters["xEnableLighting"].SetValue(true);

            foreach (EffectPass pass in effect.CurrentTechnique.Passes)
            {
                pass.Apply();

                device.Indices = terrainIndexBuffer;
                device.SetVertexBuffer(terrainVertexBuffer);

                device.DrawIndexedPrimitives(PrimitiveType.TriangleList, 0, 0, vertices.Length, 0, indices.Length / 3);

            }
        }

EDIT2:

好的,我决定再提出你的第二个建议并遇到一些问题。我修改了这样的方法:

public void ChangeTerrain(Texture2D heightmap)
        {
            Color[] mapColors = new Color[256 * 256];
            Color[] originalColors = new Color[256 * 256];
            for (int i = 0; i < 256 * 256; i++)
                originalColors[i] = new Color(0, 0, 0);

            heightMap2.GetData(mapColors);
            device.Textures[0] = null;
            device.Textures[1] = null;
            int x, y;
            int v = 1;
            if (currentMouseState.LeftButton == ButtonState.Pressed && currentMouseState.X < 512)
            {
                x = (int)currentMouseState.X / 2;
                y = (int)currentMouseState.Y / 2;
                if (x < 4)
                    x = 4;
                if (x >= 251)
                    x = 251;
                if (y < 4)
                    y = 4;
                if (y >= 251)
                    y = 251;                

                for (int i = x-4; i < x+4; i++)
                {
                    for (int j = y-4; j < y+4; j++)
                    {
                        if (i == x - 4 || i == x + 3 || j == y - 4 || j == y + 3)
                            v = 3;
                        else
                            v = 5;
                        if (mapColors[i + j * 256].R < 210)
                        {
                            mapColors[i + j * 256].R += (byte)(v);
                            mapColors[i + j * 256].G += (byte)(v);
                            mapColors[i + j * 256].B += (byte)(v);
                        }
                        heightMap2.SetData(mapColors);
                    }
                }
            }
            if (currentMouseState.RightButton == ButtonState.Pressed && currentMouseState.X < 512)
            {
                x = (int)currentMouseState.X / 2;
                y = (int)currentMouseState.Y / 2;
                if (x < 4)
                    x = 4;
                if (x >= 251)
                    x = 251;
                if (y < 4)
                    y = 4;
                if (y >= 251)
                    y = 251; 

                for (int i = x - 4; i < x + 4; i++)
                {
                    for (int j = y - 4; j < y + 4; j++)
                    {
                        if (mapColors[i + j * 256].R > 0)
                        {
                            mapColors[i + j * 256].R -= 1;
                            mapColors[i + j * 256].G -= 1;
                            mapColors[i + j * 256].B -= 1;
                        }
                        heightMap2.SetData(mapColors);
                    }
                }
            }
            if (keyState.IsKeyDown(Keys.R))
                heightMap2.SetData(originalColors);
        }

生成平面 - 仅在LoadContent()方法中生成一次: vertices仅分配一次

private void SetUpTerrainVertices()
        {
            for (int x = 0; x < terrainWidth; x++)
            {
                for (int y = 0; y < terrainLength; y++)
                {
                    vertices[x + y * terrainWidth].Position = new Vector3(x, 0, -y);
                    vertices[x + y * terrainLength].Color = Color.Gray;
                }
            }
        }

Draw方法与之前相同,但有一个额外的行:

effect.Parameters["xTexture0"].SetValue(heightMap2);

另外,我制作了名为Editor的新技术,它看起来像这样:

//------- Technique: Editor --------
struct EditorVertexToPixel
{
    float4 Position       : POSITION;    
    float4 Color        : COLOR0;
    float LightingFactor: TEXCOORD0;
    float2 TextureColor : TEXCOORD1;
};

struct EditorPixelToFrame
{
    float4 Color : COLOR0;
};

EditorVertexToPixel EditorVS( float4 inPos : POSITION, float4 inColor: COLOR, float3 inNormal: NORMAL, float2 inTextureColor: TEXCOORD1)
{    
    EditorVertexToPixel Output = (EditorVertexToPixel)0;
    float4x4 preViewProjection = mul (xView, xProjection);
    float4x4 preWorldViewProjection = mul (xWorld, preViewProjection);

    float4 Height;
    float4 position2 = inPos;
    position2.y += Height;

    Output.Color = inColor;
    Output.Position = mul(position2, preWorldViewProjection);
    Output.TextureColor = inTextureColor;

    float3 Normal = normalize(mul(normalize(inNormal), xWorld));    
    Output.LightingFactor = 1;
    if (xEnableLighting)
        Output.LightingFactor = saturate(dot(Normal, -xLightDirection));

    return Output;    
}

EditorPixelToFrame EditorPS(EditorVertexToPixel PSIn)
{
    EditorPixelToFrame Output = (EditorPixelToFrame)0;   

    //float4 height2 = tex2D(HeightSAmpler, PSIn.TextureColor); 
    float4 colorNEW = float4(0.1f, 0.1f, 0.6f, 1);
    Output.Color = PSIn.Color * colorNEW;
    Output.Color.rgb *= saturate(PSIn.LightingFactor) + xAmbient;    

    return Output;
}

technique Editor
{
    pass Pass0
    {  
        VertexShader = compile vs_3_0 EditorVS();
        PixelShader  = compile ps_3_0 EditorPS();
    }
}

此代码不起作用,因为未设置float4 Height。我想要做的是将纹理颜色采样到float4 Height(使用Sample),但我不能在VertexShader中使用采样器。我收到错误消息“X4532无法将表达式映射到顶点着色器指令集”。

然后,我红了,你可以在SampleLevel中使用VertexShader来对颜色数据进行采样,并认为我找到了解决方案,但我得到了一个奇怪的错误,只有一个俄罗斯博客记录,但我可以'说或读俄语。错误是:“X4814纹理声明上的意外别名”

有没有办法在PixelShader中对颜色进行采样,然后将其传递给VertexShader

这可能有用,因为我设法将float4 Height设置为各种值,并且它改变了顶点高度。问题是,我不知道如何在VertexShader中读取纹理颜色,或者如何将红色纹理颜色数据从PixelShader传递到VertexShader

EDIT3: 我想我找到了解决方案。正在网上搜索并发现tex2Dlod函数用作VertexShader纹理采样器。但是显示的语法不同,我无法使它们起作用。

任何人都可以指出好的HLSL文献,以了解HLSL编码。这项任务看起来很简单,但不知怎的,我无法让它发挥作用。

1 个答案:

答案 0 :(得分:2)

好的,所以我不能提供“真正的”性能建议 - 因为我没有测量你的代码。测量可能是性能优化中最重要的部分 - 您需要能够回答这些问题:“我的性能目标是否慢于我?”并且“为什么我比我的目标慢?”

话虽如此 - 作为一名经验丰富的开发人员,这些东西对我来说很突出:


  

从Update方法

调用此方法(ChangeTerrain)

您应该考虑将该方法拆分,以便不是每帧重新创建数据,而是只在实际更改地形时才能正常工作。


vertices = new VertexPositionNormalColored[terrainWidth * terrainLength];

每帧分配一个新的vertices缓冲区巨大内存分配( 6MB ,512x512)。这会对垃圾收集器造成很大的压力 - 而且我怀疑这是导致性能问题的主要原因。

鉴于您无论如何都要设置该数组中的所有数据,只需删除该行,数据中的旧数据将被覆盖。


更好的是,您可以保留未按原样更改的数据,并仅修改实际更改的顶点。就像你为heightData所做的一样。

作为其中的一部分,修改CalculateNormals是一个非常好的主意,这样,它不必依赖索引缓冲区并遍历每个三角形,而是可以计算周围顶点的索引(形成三角形)用于任何特定顶点 - 您可以执行某些操作,因为vertices是有序的。再次,有点像你为heightData所做的一样。


terrainVertexBuffer.SetData(vertices, 0, vertices.Length);

这是向GPU发送完整的6MB缓冲区。有SetData版本仅将完整缓冲区的子集发送到GPU。您应该尝试使用这些。

请记住,每个SetData调用都会带来一些开销,所以不要过于细化。最好每个顶点缓冲区只有一个调用,即使这意味着必须发送一些未修改的缓冲区部分。

这可能是唯一一个“分块”你的地形会产生重大影响的地方,因为它可以让你为每个SetData调用指定一个更紧密的区域 - 允许你发送更少的未经修改的数据。 (我会弄清楚为什么这是一个练习。)

(你已经在使用DynamicVertexBuffer,这很好,因为这意味着GPU会自动处理其缓冲区即时更改的管道问题。)


最后,如果性能仍然存在问题,您可以完全考虑不同的方法。

一个例子可能是将几何计算卸载到GPU。您将heightData转换为纹理,并使用顶点着色器(使用平顶网格作为输入)对该纹理进行采样并输出相应的位置和法线。

这种方法的一个很大的优点是heightData可以比你的顶点缓冲区小批次(在512x512处为0.25MB) - 这是CPU需要处理的数据少得多,发送到GPU。