具有单个对象字段的结构如何比原始对象更快?

时间:2013-12-03 10:20:09

标签: c# .net performance

我有一个struct,其中包含一个object字段,可以更轻松地处理对象。我想测试性能(我预计会有一些降级),但是我得到了非常令人惊讶的结果。 struct的版本实际上更快:

  

没有方框:8.08秒

     

带框:7.76秒

这怎么可能?

以下是重现结果的完整测试代码。

using System;
using System.Collections.Generic;
using System.Diagnostics;
using System.Linq;
using System.Runtime.CompilerServices;
using System.Text;
using System.Threading.Tasks;

namespace ConsoleApplication68
{
    partial class Program
    {
        private const int Iterations = 100000000;

        static void Main(string[] args)
        {
            // Force JIT compilation.

            TimeWithoutBox(new MyObject());
            TimeWithoutBox(7);
            TimeBox(new MyObject());
            TimeBox(7);

            // The tests.

            var withoutBox = new TimeSpan();
            var box = new TimeSpan();

            for (int i = 0; i < 10; i++)
            {
                withoutBox += TimeWithoutBox(new MyObject());
                withoutBox += TimeWithoutBox(7);
                box += TimeBox(new MyObject());
                box += TimeBox(7);
            }

            Console.WriteLine("Without box: " + withoutBox);
            Console.WriteLine("With box: " + box);

            Console.ReadLine();
        }

        private static TimeSpan TimeBox(object value)
        {
            var box = new MyBox(value);

            var stopwatch = Stopwatch.StartNew();

            for (int i = 0; i < Iterations; i++)
            {
                TestBox(box);
            }

            return stopwatch.Elapsed;
        }

        private static TimeSpan TimeWithoutBox(object value)
        {
            var stopwatch = Stopwatch.StartNew();

            for (int i = 0; i < Iterations; i++)
            {
                TestWithoutBox(value);
            }

            return stopwatch.Elapsed;
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        private static void TestBox(MyBox box)
        {
            if (box.IsDouble)
                TakeDouble((double)box.Value);
            else if (box.IsObject)
                TakeObject((MyObject)box.Value);
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        private static void TestWithoutBox(object box)
        {
            if (box.GetType() == typeof(double))
                TakeDouble((double)box);
            else if (box.GetType() == typeof(MyObject))
                TakeObject((MyObject)box);
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        private static void TakeDouble(double value)
        {
            // Empty method to force consuming the cast.
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        private static void TakeObject(MyObject value)
        {
            // Empty method to force consuming the cast.
        }
    }

    struct MyBox
    {
        private readonly object _value;

        public object Value
        {
            get { return _value; }
        }

        public MyBox(object value)
        {
            _value = value;
        }

        public bool IsDouble
        {
            get { return _value.GetType() == typeof(double); }
        }

        public bool IsObject
        {
            get { return _value.GetType() == typeof(MyObject); }
        }
    }

    class MyObject
    {
    }
}

修改

我已将IsDoubleIsObject测试更改为与其他测试具有相同的语句。我重新执行了应用程序,结果时间完全相同。

EDIT2:

此代码是使用发布构建版本在 32位编译时测试的,没有附加的调试器; .NET 4.5和Visual Studio 2012.针对64位进行编译会产生截然不同的结果;在我的机器上:

  

没有方框:8.23 s

     

带框:16.99秒

1 个答案:

答案 0 :(得分:4)

我复制了确切的代码,在没有调试器的情况下运行Release(两者都很重要!)和x64。结果:

Without box: 00:00:07.9650541
With box: 00:00:16.0958162

将测试更改为:

    [MethodImpl(MethodImplOptions.NoInlining)]
    private static void TestBox(MyBox box)
    {
        if (box.Value.GetType() == typeof(double))
            TakeDouble((double)box.Value);
        else if (box.Value.GetType() == typeof(MyObject))
            TakeObject((MyObject)box.Value);
    }

使运行时间几乎相等:

Without box: 00:00:07.9488281
With box: 00:00:08.6084029

为什么呢?因为JIT决定不内联IsDouble和手动内联有帮助。这很奇怪,因为它是一个如此小的功能。第13行的call就是这个电话。

enter image description here

现在为什么还有一些性能差异? .NET JIT不是那里最好的编译器......可能有一些指令有点不同。您可以通过比较两个版本的反汇编来找到答案。我没有时间,因为我认为这种差异是无趣的。

我希望C编译器能够做到这一点。结构应该像它包含的单个object成员一样。应该内联小方法。这对今天的编译器技术来说绝对可行。让我们希望下一代JIT和NGEN可以做到这一点。目前正在开发一种新的JIT(RyuJIT),他们正在将优化从VC后端转移到NGEN(最近宣布)。