为什么Mono在Linux和BSD上运行速度要慢1/3?

时间:2013-10-31 19:06:19

标签: .net linux macos mono bsd

编辑:在第二篇文章中查看以下更好的基准!!!

我使用.NET 4.5和Mono 3.2.x进行了一些性能测试(Win8.1,Linux,BSD和OSX)。

请注意:这些测试是使用Mono x86或.NET x86 arch编译的。他们没有在Virtual Box中运行。测试计算机是三重启动的,“Win8 / Linux / BSD”本机运行,Mac双启动“OSX / Win7”。另请注意,“Win32”编译器指令仅在Win8 / Win7上用于“TimeBeginPeriod”,以在Windows中强制准确的秒表精度。 Linux / BSD / OSX不需要这个,但是Windows会这样做。

以下是测试代码

using System;
using System.Collections.Generic;
using System.Text;
using System.Threading.Tasks;
using System.Diagnostics;

using numf = System.Single;
using numi = System.Int32;

#if WIN32
using System.Runtime.InteropServices;
#endif

namespace Benchmarks
{
    struct Vector4
    {
        public numf X, Y, Z, W;

        public static Vector4 operator+(Vector4 p1, Vector4 p2)
        {
            p1.X += p2.X;
            p1.Y += p2.Y;
            p1.Z += p2.Z;
            p1.W += p2.W;
            return p1;
        }

        public static Vector4 operator-(Vector4 p1, Vector4 p2)
        {
            p1.X -= p2.X;
            p1.Y -= p2.Y;
            p1.Z -= p2.Z;
            p1.W -= p2.W;
            return p1;
        }

        public static Vector4 operator*(Vector4 p1, Vector4 p2)
        {
            p1.X *= p2.X;
            p1.Y *= p2.Y;
            p1.Z *= p2.Z;
            p1.W *= p2.W;
            return p1;
        }

        public static Vector4 operator/(Vector4 p1, Vector4 p2)
        {
            p1.X /= p2.X;
            p1.Y /= p2.Y;
            p1.Z /= p2.Z;
            p1.W /= p2.W;
            return p1;
        }

        public override string ToString()
        {
            return string.Format("{0}, {1}, {2}, {3}", X, Y, Z, W);
        }
    }

    class Program
    {
        #if WIN32
        [StructLayout(LayoutKind.Sequential)]
        public struct TimeCaps
        {
            public uint wPeriodMin;
            public uint wPeriodMax;
        }

        private static TimeCaps caps;

        [DllImport("winmm.dll", EntryPoint="timeGetDevCaps", SetLastError=true)]
        public static extern uint TimeGetDevCaps(ref TimeCaps timeCaps, uint sizeTimeCaps);

        [DllImport("winmm.dll", EntryPoint="timeBeginPeriod", SetLastError=true)]
        public static extern uint TimeBeginPeriod(uint uMilliseconds);

        [DllImport("winmm.dll", EntryPoint="timeEndPeriod", SetLastError=true)]
        public static extern uint TimeEndPeriod(uint uMilliseconds);

        public static void OptimizedMode()
        {
            caps = new TimeCaps();
            if (TimeGetDevCaps(ref caps, (uint)System.Runtime.InteropServices.Marshal.SizeOf(caps)) != 0)
            {
                Console.WriteLine("StopWatch: TimeGetDevCaps failed");
            }

            if (TimeBeginPeriod(caps.wPeriodMin) != 0)
            {
                Console.WriteLine("StopWatch: TimeBeginPeriod failed");
            }
        }

        public static void EndOptimizedMode()
        {
            if (TimeEndPeriod(caps.wPeriodMin) != 0)
            {
                Console.WriteLine("StopWatch: TimeEndPeriod failed");
            }
        }
        #endif

        static Random random;

        static void Main(string[] args)
        {
            #if WIN32
            OptimizedMode();
            #endif

            random = new Random();
            Console.WriteLine("Enter loop count:");
            Console.WriteLine("999999");
            string value = Console.ReadLine();
            int count;
            if (int.TryParse(value, out count))
            {
                runVector4Test(count);
            }
            else
            {
                Console.WriteLine("Invalide value: " + value);
            }

            #if WIN32
            EndOptimizedMode();
            #endif

            Console.WriteLine("DONE");
            Console.ReadLine();
        }

        static void runVector4Test(int count)
        {
            var values = new Vector4[count];
            const double range = .01;
            for (int i = 0; i != count; ++i)
            {
                values[i].X = (numf)(random.NextDouble() * range) + 1;
                values[i].Y = (numf)(random.NextDouble() * range) + 1;
                values[i].Z = (numf)(random.NextDouble() * range) + 1;
                values[i].W = (numf)(random.NextDouble() * range) + 1;
            }

            Console.WriteLine("Waiting for GC...");
            GC.Collect();
            System.Threading.Thread.Sleep(5000);
            Console.WriteLine("Starting Vector4 Test...");

            var time = new Stopwatch();
            long totalTime = 0;
            Vector4 totalValue = new Vector4();
            for (int i = 0; i != 100; ++i)
            {
                time.Restart();
                for (int i2 = 0; i2 < count-1; ++i2)
                {
                    Vector4 vec1 = values[i2];
                    Vector4 vec2 = values[i2+1];
                    totalValue += vec1;
                    totalValue -= vec2;
                    totalValue /= vec1;
                    totalValue *= vec2;
                }
                time.Stop();
                totalTime += time.ElapsedMilliseconds;
            }

            Console.WriteLine("Vector4 Time: " + (totalTime / 100d));
            Console.WriteLine("Vector4 Values: " + totalValue);
            Console.WriteLine();
        }
    }
}

以下是结果

<<< AMD Athlon 64 X2 Dual Core 4600+ 2.40GHz >>>
{
.NET 4.5 (Win8-Win32) = 39.9 mil

Mono 3.2.3 (Win8-Win32) = 99.49 mil
Mono 3.2.3 (PC-Linux) = 146.87 mil
Mono 3.2.1 (PC-BSD) = 144 mil
}


<<< Intel Core2 Duo P8600 2.40GHz >>>
{
Mono 3.2.3 (OSX 10.9) = 98.54 mil
.NET 4.5 (Win7-Win32) = 38.47 mil
}

为什么Linux和BSD上的Mono运行速度比Windows和OSX上的Mono慢1/3

2 个答案:

答案 0 :(得分:1)

enter image description here

好的我做了一个更好的基准测试( RayTraceBenchmark ):https://github.com/zezba9000/RayTraceBenchmark(随意做拉动请求以添加更多langs或发布端口[希望看到结果] )

渲染3D场景并保存RAW图像文件。您可以通过Photoshop或其他任何方式打开图像。图像分辨率为1280x720。

以下是测试中的当前解决方案:https://github.com/zezba9000/RayTraceBenchmark/blob/master/C%23/Results.md

正如您所看到的,Linux / BSD在同一台计算机上运行速度仍然较慢?这应该不会发生?

<<< AMD Athlon 64 X2 Dual Core 4600+ 2.40GHz >>>
.NET 4.5 (Win8-Win32)
(x86) = 1.179 sec
(x64) = 1.549 sec

Mono 3.2.3 (Win8-Win32)
(x86) = 2.059 sec
(x64) = 2.07 sec

Mono 3.2.3 (PC-Linux)
(x86) = 2.425
(x64) = 2.409

Mono 3.2.1 (PC-BSD)
(x86) = 2.536
(x64) = 2.509

<<< Intel Core2 Duo P8600 2.40GHz >>>
.NET 4.5 (Win7-Win32)
(x86) = 1.05 sec
(x64) = 1.132 sec

Mono 3.2.3 (Win7-Win32) 
(x86) = 1.692 sec
(x64) = 1.702 sec

Mono 3.2.3 (OSX 10.9)
(x86) = 1.675 sec
(x64) = 1.679 sec

答案 1 :(得分:1)

最后我查了一下,Mono的编译器技术基于iburg,这是1983年的热门话题(这是我在学校学到的 - 大约在1984年 - 由于Davidson&amp; Fraser&amp; Hansen),但它是基于固定的(通常是乐观的)加载延迟和非流水线指令调度。从那时起,我们已经有了两种新算法(例如:http://pages.cs.wisc.edu/~fischer/cs701.f08/eggers.pdf - 关于负载延迟的论文,大约1992年,加上例如现在用于clang和gcc中的多个问题调度的基于资源的CPU调度,其中,IIRC,好论文开始出现在大约2000年)。所以这可能解释了那里可能有5-30%的性能。

此外,还有GC性能:单声道在这方面落后,而微软则与那些非常擅长的JVM人员(IBM,Sun)竞争。我的感觉是,尽管单声道项目是一项伟大的工作,但它的工作已经完成,它只是跟上微软不断积累的所有新东西(留下很少的时间用于编译器,GC性能,VM,...改进)。请记住,MS将大部分新代码写入.Net,并且非常有兴趣使其快速生成(并且它们总是拥有不错的编译器)。

所以有很多理由说为什么perf可能会有所不同。然后,它是开源的,如果人们足够关心他们可以做出贡献。