Question

所以我正在使用XNA 3.1制作一个东西，并且我有许多通过像素着色器应用的单独效果。它们来自各种来源，例如特殊攻击，环境等。我遇到的问题是我注意到帧速率的显着降低。

目前，我正在将整个场景绘制到RenderTarget2D，然后我将所有效果应用到。我存储了一个包含效果及其ID的SortedDictionary（这些ID用于在运行时更改参数），我正在迭代它并逐个应用每个效果：

foreach(KeyValuePair<Ref<int>,Effect> p in renderEffects)
{
    Effect r = p.Value;
    g.SetRenderTarget(0, MainGame.MainRenderTarget);
    //Change RenderTarget to allow code to grab existing texture in the same draw area.
    levelDraw = MainGame.LevelRenderTarget.GetTexture();
    //Change back to draw back to this texture, allowing render effects to be layered.
    g.SetRenderTarget(0, MainGame.LevelRenderTarget);

    MainGame.StartDraw(MainGame.GameBatch);
    //Starts the sprite batch and sets some parameters
    r.Begin();
    r.CurrentTechnique.Passes[0].Begin();
    MainGame.GameBatch.Draw(levelDraw, new Rectangle(0, 0, levelDraw.Width, levelDraw.Height), Color.White);
    r.CurrentTechnique.Passes[0].End();
    r.End();
    MainGame.GameBatch.End();
}

现在，当仅分层3个效果时，这会产生明显的帧丢失，而当应用10时，它会从60FPS下降到16FPS，这当然是不可接受的。我想知道是否有更有效的方法来做到这一点。考虑到我只有一个纹理，我认为我可以将效果组合到一个文件中并执行多次传递而不会重新获取纹理。但是，我不确定这是否可行。

我不确定最好的方法是如何做到这一点，尽管我认为必须有比我正在做的更好的方式。

Answer 1

代码段中的方法可能非常慢，因为你正在为每个效果进行纹理抓取和全屏绘制，这会强调CPU和GPU之间的内存带宽，而不是内部的任何内容着色器。正如您在帖子中建议的那样，您可能需要创建一组着色器，每个着色器包含多个操作，而不是一遍又一遍地运行读写循环：一个昂贵的着色器通常仍然比许多读写重复更快简单的着色器。

您可能需要查看Shawn Hargreaves article on shader fragments in HLSL和Tim Jones's code for doing this in XNA

Answer 2

你画画时是否完全遮蔽了一切？如果着色器计算量很大，则应首先进行“深度传递”，仅测试/写入Z缓冲区（颜色缓冲区写入关闭）。此外，使用简单的简单着色器“深度填充”屏幕。

换句话说，渲染所有不透明对象仅在第一次传递时更新深度缓冲区。

在第二遍中，您打开着色器（并关闭深度写入，不需要使用带宽来回写已经存在的相同值）。这将掩盖任何透支像素的所有不必要的工作，因为它们将立即无法进行深度测试。

编辑：现在我意识到OP正在进行全屏效果，而不是场景渲染。

有效组合多个像素着色器

2 个答案: