好的,我有80,000个“Box”网格,纹理简单 我设置了视距和 只画出你能看到的 对于下面的DrawModel函数,它留下600到1000 问题是我每秒只得到10帧,我的视距很糟糕 此外,我已对所有代码进行了内存测试,“mesh.draw()”每秒关闭30帧。 没有别的东西接近那么多。 有什么帮助吗?
private void DrawModel(MeshHolder tmpMH)
{
Model tmpDrawModel = (Model)_Meshs[tmpMH.MeshFileName];
Matrix[] transforms = new Matrix[tmpDrawModel.Bones.Count];
tmpDrawModel.CopyAbsoluteBoneTransformsTo(transforms);
foreach (ModelMesh mesh in tmpDrawModel.Meshes)
{
foreach (BasicEffect effect in mesh.Effects)
{
effect.LightingEnabled = false;
effect.TextureEnabled = true;
effect.Texture = (Texture2D)_Textures[tmpMH.GetTexture(Count)];
effect.View = _MainCam.View;
effect.Projection = _projection;
effect.World =
transforms[mesh.ParentBone.Index] *
Matrix.CreateFromYawPitchRoll(tmpMH.Rotation.Y, tmpMH.Rotation.X, tmpMH.Rotation.Z) *
Matrix.CreateScale(tmpMH.Scale) *
Matrix.CreateTranslation(tmpMH.Position);
}
mesh.Draw();
}
}
答案 0 :(得分:7)
正如你所说,正在扼杀你的表现的是ModelMesh.Draw
。绘制模型时,它的工作方式如下:
for each frame
for each Model
for each ModelMesh // you call Draw(), which does:
for each ModelMeshPart
for each Effect
for each EffectPass
Draw some triangles // sends a batch of instructions to the GPU
所以问题是:你每批发送批次到GPU的次数是多少?因为在饱和CPU之前,每帧只能发送几千*个批次 - 达到“批量限制”。 (每个批处理使用图形驱动程序中的CPU时间 - 它也使用一些带宽和GPU时间,但CPU时间占主导地位。)
您可能需要阅读this answer和this answer以及this slide deck以获取更多信息。
解决方案是修改您的场景(例如:组合一些网格部件,进行一些剔除,添加实例支持)以减少您发送到GPU的批次数。
另外,请尝试在Draw
和Update
循环中避免这样的事情:
Matrix[] transforms = new Matrix[tmpDrawModel.Bones.Count];
你应该尽力避免每帧发生的内存分配 - 因为它们最终会导致昂贵的垃圾收集和可能的帧率打嗝(特别是在Xbox上)。尝试将缓冲区存储在某处并重复使用。
答案 1 :(得分:3)
effect.World =
transforms[mesh.ParentBone.Index] *
Matrix.CreateFromYawPitchRoll(
tmpMH.Rotation.Y, tmpMH.Rotation.X, tmpMH.Rotation.Z) *
Matrix.CreateScale(tmpMH.Scale) *
Matrix.CreateTranslation(tmpMH.Position);
我不是一个探查者,但我觉得这条线很痛苦。矩阵创建和乘法非常昂贵!我理解这段代码是必要的,除非你能预先计算这些矩阵,否则我会尝试:
Matrix pitch, scale, translation, temp1, temp2;
Matrix.CreateFromYawPitchRoll(
tmpMH.Rotation.Y, tmpMH.Rotation.X, tmpMH.Rotation.Z, out pitch);
Matrix.CreateScale(ref tmpMH.Scale, out scale);
Matrix.CreateTranslation(ref tmpMH.Position, out translation);
Matrix.Multiply(ref transforms[mesh.ParentBone.Index], ref pitch, out temp1);
Matrix.Multiply(ref temp1, ref scale, out temp2);
Matrix.Multiply(ref temp2, ref translation, out effect.World);
这可能会更快,因为无需复制堆栈上的每个矩阵以进行参数传递(复制的内容减少20倍以上!)