c ++和c#速度比较

时间:2010-03-23 00:46:26

标签: c# c++ benchmarking

当你需要使用原始CPU功率时,我很担心C#处理繁重计算时的速度。

在计算方面,我一直认为C ++比C#快得多。所以我做了一些快速测试。第一个测试计算素数<整数n,第二个测试计算一些pandigital数字。第二次测试的想法来自:Pandigital Numbers

C#prime计算:

using System;
using System.Diagnostics;

class Program
{

    static int primes(int n)
    {

        uint i, j;
        int countprimes = 0;

        for (i = 1; i <= n; i++)
        {
            bool isprime = true;

            for (j = 2; j <= Math.Sqrt(i); j++)

                if ((i % j) == 0)
                {
                    isprime = false;
                    break;
                }

            if (isprime) countprimes++;
        }

        return countprimes;
    }



    static void Main(string[] args)
    {
        int n = int.Parse(Console.ReadLine());
        Stopwatch sw = new Stopwatch();

        sw.Start();
        int res = primes(n);
        sw.Stop();
        Console.WriteLine("I found {0} prime numbers between 0 and {1} in {2} msecs.", res, n, sw.ElapsedMilliseconds);
        Console.ReadKey();
    }
}

C ++变体:

#include <iostream>
#include <ctime>
#include <cmath>

int primes(unsigned long n) {
unsigned long i, j;
int countprimes = 0;
  for(i = 1; i <= n; i++) {
      int isprime = 1;
      for(j = 2; j < sqrt((float)i); j++) 
          if(!(i%j)) {
        isprime = 0;
        break;
   }
    countprimes+= isprime;
  }
  return countprimes;
}

int main() {
 int n, res;
 cin>>n;
 unsigned int start = clock();

 res = primes(n);
 int tprime = clock() - start;
 cout<<"\nI found "<<res<<" prime numbers between 1 and "<<n<<" in "<<tprime<<" msecs.";
 return 0;
}

当我运行测试时试图找到素数&lt;超过100,000,C#变体在0.409秒内完成,C ++变体在0.614秒内完成。 当我运行它们为1,000,000 C#时完成6.039秒而C ++运行时间约为12.987秒。

C#中的Pandigital测试:

using System;
using System.Diagnostics;

class Program
{
    static bool IsPandigital(int n)
    {
        int digits = 0; int count = 0; int tmp;

        for (; n > 0; n /= 10, ++count)
        {
            if ((tmp = digits) == (digits |= 1 << (n - ((n / 10) * 10) - 1)))
                return false;
        }

        return digits == (1 << count) - 1;
    }

    static void Main()
    {
        int pans = 0;
        Stopwatch sw = new Stopwatch();
        sw.Start();

        for (int i = 1; i <= 123456789; i++)
        {
            if (IsPandigital(i))
            {
                pans++;
            }
        }
        sw.Stop();
        Console.WriteLine("{0}pcs, {1}ms", pans, sw.ElapsedMilliseconds);
        Console.ReadKey();
    }
}

C ++中的Pandigital测试:

#include <iostream>
#include <ctime>

using namespace std;

int IsPandigital(int n)
    {
        int digits = 0; int count = 0; int tmp;

        for (; n > 0; n /= 10, ++count)
        {
            if ((tmp = digits) == (digits |= 1 << (n - ((n / 10) * 10) - 1)))
                return 0;
        }

        return digits == (1 << count) - 1;
    }


int main() {
   int pans = 0;
   unsigned int start = clock();

   for (int i = 1; i <= 123456789; i++)
   {
      if (IsPandigital(i))
      {
        pans++;
      }
   }
   int ptime = clock() - start;
   cout<<"\nPans:"<<pans<<" time:"<<ptime;  
   return 0;
}

C#variant在29.906秒内运行,C ++在36.298秒内运行。

我没有触及任何编译器开关,并且C#和C ++程序都是使用调试选项编译的。 在我尝试运行测试之前,我担心C#会远远落后于C ++,但现在似乎C#的优势速度差异很大。

有人可以解释一下吗? C#是jitted而C ++是原生编译的,因此C ++比C#变体更快是正常的。

感谢您的回答!

我已经为发布配置重新进行了所有测试。

首次测试(素数)

C#(数字<100,0000):0.189秒 C ++(数字<100,0000):0.036秒

C#(数字<1,000,000):5.300秒 C ++(nummbers&lt; 1,000,000):1.166秒

第二次测试(pandigital数字):

C#:21.224秒 C ++:4.104秒

所以,每一件事都发生了变化,现在C ++的速度要快得多。我的错误是我已经运行了Debug配置测试。如果我通过ngen运行C#可执行文件,我能看到一些速度提升吗?

我试图比较C#和C ++的原因是因为我知道两者的一些基础知识,我想学习一个处理GUI的API。我认为WPF很好,所以考虑到我的目标是桌面,我想看看C#在使用纯粹的CPU能力来计算各种计算(文件存档,加密,编解码器等)时能否提供足够的速度和性能。但遗憾的是,C#在速度方面无法与C ++保持同步。

所以,我假设我将永远坚持这个问题Tough question on WPF, Win32, MFC,我会更新找到合适的API。

10 个答案:

答案 0 :(得分:12)

您需要在发布模式下编译C ++并启用优化以获得您正在寻找的性能结果。

答案 1 :(得分:11)

C ++中的素数生成器不正确

i ^(1/2)== i xor 0

^是按位xor运算符,/是整数除法。

第一次修改,这是正确但无效的: 由于i xor 0 == i,筛子不会停在sqrt(i)但是停在i。

第二次修改:

筛分可以更有效率地完成。 (您只需要计算sqrt(n))。 这就是我为自己使用Eratosthenes筛子的方法(虽然这是在C99):

void sieve(const int n, unsigned char* primes)
{
        memset(primes, 1, (n+1) * sizeof(unsigned char));

        // sieve of eratosthenes
        primes[0] = primes[1] = 0;
        int m = floor(sqrt(n));
        for (int i = 2; i <= m; i++)
                if (primes[i]) // no need to remove multiples of i if it is not prime
                        for (int j = i; j <= (n/i); j++)
                                primes[i*j] = 0;
}

答案 2 :(得分:9)

为什么你会认为jitted代码比本机代码慢?唯一的速度惩罚是实际的点击,只发生一次(一般来说)。鉴于一个运行时间为30秒的程序,我们讨论的是总成本的一小部分。

我认为你可能会将jitted代码与解释代码混淆,后者是逐行编译的。这两者之间存在非常显着的差异。

正如其他人所指出的,你还需要在发布模式下运行它;调试模式将关闭大多数优化,因此两个版本都会比它们应该更慢(但是数量不同)。

编辑 - 我应该指出另一件事,就是这一行:

for (j = 2; j <= Math.Sqrt(i); j++)

非常低效并且可能会干扰基准测试。您应该计算内循环的<{1}} 。这可能会使两个版本的速度减慢相等,但我不确定,不同的编译器会执行不同的优化。

答案 3 :(得分:6)

因为算法错误所以需要更长的时间。

for(j = 2; j < (i^(1/2)); j++) 

相同
for(j = 2; j < (i^0); j++) 

相同
for(j = 2; j < i; j++) 

我比sqrt(i)大很多。看一下运行时间,它应该在C ++实现中大一个数量级。

另外,就像其他人一样,我认为在调试模式下进行性能测试是不合理的。

答案 4 :(得分:3)

在打开完全优化的情况下重新编译C ++程序并重新运行测试。 C#jit会在jitted时优化代码,因此您将优化的C#/ .NET代码与未经优化的C ++进行了比较。

答案 5 :(得分:2)

首先,永远不要在调试模式下执行此类基准测试。要获得有意义的数字,请始终使用发布模式。

JIT的优势在于知道它运行的平台,而预编译的代码对于运行它的平台可能不是最理想的。

答案 6 :(得分:2)

托管代码中的JIT编译器生成的机器代码效率远远低于C / C ++编译器生成的机器代码,这是一个持久的神话。托管代码通常在内存管理和浮点数学上获胜,当代码优化器可以花费更多时间优化代码时,C / C ++通常会获胜。一般来说,托管代码大约是80%,但它完全取决于程序花费90%时间的代码的10%。

您的测试不会显示此信息,您没有启用优化器,并且没有太多优化。

答案 7 :(得分:0)

两个测试都无效,因为您编译时没有进行优化。

由于代码中的错误,第一次测试即使是未优化行为的比较也毫无意义; Math.Sqrt(i)返回i的平方根,i^(1/2)返回i - 所以C ++做的工作比C#多得多。

更一般地说,这不是一件有用的事情 - 你正在尝试创建一个对现实世界使用几乎没有任何影响的综合基准。

答案 8 :(得分:0)

伙计们,在比较程序速度之前,请仔细阅读有关cpu指令,汇编,缓存管理等的几篇文章。 作者只是一个可笑的搞笑伙伴。检查调试构建的性能。

比利奥尼尔 - 分配一个大缓冲区和只使用它的一小部分,并在低语言单词中使用动态分配的东西(如vector)之间的区别是什么? 一旦分配了大缓冲区 - 没有人会对未使用的东西感到烦恼。无需进一步的支持操作。对于像vector这样的动态内容 - 对内存边界的不断检查不需要超出它。 请记住,C ++程序员不只是懒惰(我承认这是真的,但他们也很聪明。)

答案 9 :(得分:0)

这个怎么样:

for(sqrti = 1; sqrti <= 11112; sqrti++) {
  int nexti = (1+sqrti)*(1+sqrti)
  for (i = sqrti*sqrti; i < nexti; i++)
  {
    int isprime = 1;
    for(j = 2; j < sqrti; j++) 
        if(!(i%j)) {
      isprime = 0;
      break;
    }
  }

}    countprimes + = isprime;   }