C#for循环和Array.Fill之间的性能差异

时间:2019-01-08 16:53:18

标签: c# arrays .net performance benchmarkdotnet

我已经使用BenchmarkDotNet实现了以下基准测试:

public class ForVsFillVsEnumerable
{
    private bool[] data;

    [Params(10, 100, 1000)]
    public int N;

    [GlobalSetup]
    public void Setup()
    {
        data = new bool[N];
    }

    [Benchmark]
    public void Fill()
    {
        Array.Fill(data, true);
    }

    [Benchmark]
    public void For()
    {           
        for (int i = 0; i < data.Length; i++)
        {
            data[i] = true;
        }
    }

    [Benchmark]
    public void EnumerableRepeat()
    {
        data = Enumerable.Repeat(true, N).ToArray();
    }
}

结果是:

BenchmarkDotNet=v0.11.3, OS=Windows 10.0.17763.195 (1809/October2018Update/Redstone5)
Intel Core i7-8700K CPU 3.70GHz (Coffee Lake), 1 CPU, 12 logical and 6 physical cores
.NET Core SDK=2.2.200-preview-009648
  [Host] : .NET Core 2.2.0 (CoreCLR 4.6.27110.04, CoreFX 4.6.27110.04), 64bit RyuJIT
  Core   : .NET Core 2.2.0 (CoreCLR 4.6.27110.04, CoreFX 4.6.27110.04), 64bit RyuJIT

Job=Core  Runtime=Core
           Method |    N |       Mean |      Error |      StdDev |     Median | Ratio | Rank |
----------------- |----- |-----------:|-----------:|------------:|-----------:|------:|-----:|
             Fill |   10 |   3.675 ns |  0.2550 ns |   0.7150 ns |   3.331 ns |  1.00 |    1 |
                  |      |            |            |             |            |       |      |
              For |   10 |   6.615 ns |  0.3928 ns |   1.1581 ns |   6.056 ns |  1.00 |    1 |
                  |      |            |            |             |            |       |      |
 EnumerableRepeat |   10 |  25.388 ns |  1.0451 ns |   2.9307 ns |  24.170 ns |  1.00 |    1 |
                  |      |            |            |             |            |       |      |
             Fill |  100 |  50.557 ns |  2.0766 ns |   6.1229 ns |  46.690 ns |  1.00 |    1 |
                  |      |            |            |             |            |       |      |
              For |  100 |  64.330 ns |  4.0058 ns |  11.8111 ns |  59.442 ns |  1.00 |    1 |
                  |      |            |            |             |            |       |      |
 EnumerableRepeat |  100 |  81.784 ns |  4.2407 ns |  12.5039 ns |  75.937 ns |  1.00 |    1 |
                  |      |            |            |             |            |       |      |
             Fill | 1000 | 447.016 ns | 15.4420 ns |  45.5312 ns | 420.239 ns |  1.00 |    1 |
                  |      |            |            |             |            |       |      |
              For | 1000 | 589.243 ns | 51.3450 ns | 151.3917 ns | 495.177 ns |  1.00 |    1 |
                  |      |            |            |             |            |       |      |
 EnumerableRepeat | 1000 | 519.124 ns | 21.3580 ns |  62.9746 ns | 505.573 ns |  1.00 |    1 |

最初,我猜测Array.Fill进行了一些优化,使其比for循环的性能更好,但是随后我检查了。NET Core source code,以了解Array.Fill的实现非常简单:

public static void Fill<T>(T[] array, T value)
{
    if (array == null)
    {
        ThrowHelper.ThrowArgumentNullException(ExceptionArgument.array);
    }

    for (int i = 0; i < array.Length; i++)
    {
        array[i] = value;
    }
}

性能足够接近,但是看起来Fill始终比for快一点,尽管在幕后它是完全相同的代码。你能解释为什么吗?还是我只是错误地读取了结果?

1 个答案:

答案 0 :(得分:12)

我为Enumerable.Repeat()感到惊讶,这与我的第一个想法很好地相反。无论如何,要回答您的问题:当您使用For()时,您反复访问一个类成员,而在调用Array.Fill()时,您仅获得其地址一次。

令我惊讶的是,编译器没有检测到并优化该值,而是读取类成员的值,您需要先ldarg.0才能得到this,然后再得到{{1 }}以获取其实际地址。在ldfld ForVsFillVsEnumerable.data中,只需调用一次即可调用ForVsFillVsEnumerable.Fill()

您可以通过编写自己的填充函数来检查:

Array.Fill()

注1:无论性能如何,使用库函数总是更好,因为它可能会在将来的优化中受益(例如,他们可能会决定为[Benchmark] public void For2() { ForImpl(data); } private static void ForImpl(bool[] data) { for (int i = 0; i < data.Length; i++) { data[i] = true; } } 添加特定的重载,并使用本机代码实现它们其中-对于某些架构-简单的Array.Fill()非常快)。

注2:如果循环代码是如此之小(且快速),我将避免使用较小的矢量(10或100个项)来测量任何东西,因为要设置合适的测试环境以可靠地测量几纳秒的差是极其困难的。我认为一开始的最低要求是1000(甚至100,000)(即使在这种情况下,很多其他事情也将起着重要的作用...)除非您的实际用例是10/100 ...在这种情况下,我会尝试测量一个更大的算法,这种差异更明显(如果不是,那么您就不必在意)。