并行循环和随机产生奇数结果

时间:2010-05-27 20:22:19

标签: random parallel-processing simulation task-parallel-library

我刚开始玩任务并行库,遇到了有趣的问题;我对将要发生的事情有一个大概的了解,但是希望听到比我更有能力帮助理解正在发生的事情的人的评论。我为有点冗长的代码道歉。

我开始使用随机游走的非并行模拟:

 var random = new Random();
 Stopwatch stopwatch = new Stopwatch();

 stopwatch.Start();

 var simulations = new List<int>();
 for (var run = 0; run < 20; run++)
 {
    var position = 0;
    for (var step = 0; step < 10000000; step++)
    {
       if (random.Next(0, 2) == 0)
       {
          position--;
       }
       else
       {
          position++;
       }
    }

    Console.WriteLine(string.Format("Terminated run {0} at position {1}.", run, position));
    simulations.Add(position);
 }

 Console.WriteLine(string.Format("Average position: {0} .", simulations.Average()));
 stopwatch.Stop();

 Console.WriteLine(string.Format("Time elapsed: {0}", stopwatch.ElapsedMilliseconds));
 Console.ReadLine();

然后我在并行循环中写了我的第一次尝试:

 var localRandom = new Random();

 stopwatch.Reset();
 stopwatch.Start();

 var parallelSimulations = new List<int>();
 Parallel.For(0, 20, run =>
 {
    var position = 0;
    for (var step = 0; step < 10000000; step++)
    {
       if (localRandom.Next(0, 2) == 0)
       {
          position--;
       }
       else
       {
          position++;
       }
    }

    Console.WriteLine(string.Format("Terminated run {0} at position {1}.", run, position));
    parallelSimulations.Add(position);
 });


 Console.WriteLine(string.Format("Average position: {0} .", parallelSimulations.Average()));
 stopwatch.Stop();

 Console.WriteLine(string.Format("Time elapsed: {0}", stopwatch.ElapsedMilliseconds));

 Console.ReadLine();

当我在设置为仅使用1个核心的虚拟机上运行它时,我观察到了相似的持续时间,但运行不再按顺序处理 - 毫不奇怪。

当我在双核机器上运行时,事情变得奇怪了。我没有看到任何时间的改进,并且每次运行都观察到一些非常奇怪的结果。大多数运行最终结果为-1,000,000(或非常接近),这表明Random.Next一直返回0准。

当我为每个循环制作随机局部时,一切正常,我得到了预期的持续时间改进:

Parallel.For(0, 20, run =>
         {
            var localRandom = new Random();
            var position = 0; 

我的猜测是问题与Random对象在循环之间共享并且具有某种状态这一事实有关。 “失败并行”版本的持续时间缺乏改善是我假设由于没有并行处理对Random的调用这一事实(即使我看到并行版本使用两个核心,而原始版本没有) 。我真正没有得到的部分是为什么模拟结果是它们的原因。

我有一个单独的担心是,如果我在每个循环中使用局部的Random实例,我可能会遇到以同一种子开头的多个循环的问题(当你生成多个Random时,你得到的问题,导致相同的序列)。

对正在发生的事情的任何见解对我来说都是非常有价值的!

3 个答案:

答案 0 :(得分:2)

Random类不是线程安全的;如果你在多个线程上使用它,它可能会搞砸。

您应该在每个线程上创建一个单独的Random实例,并确保它们最终不会使用相同的种子。 (例如,Environment.TickCount * Thread.CurrentThread.ManagedThreadId

答案 1 :(得分:2)

这些方法都不会给你真正好的随机数。

此博客文章介绍了使用Random

获取更好的随机数的许多方法

http://blogs.msdn.com/b/pfxteam/archive/2009/02/19/9434171.aspx

这些可能适用于许多日常应用。

但是,如果您在多个线程上使用相同的随机数生成器,即使使用不同的种子,您仍然会影响随机数的质量。这是因为您正在生成可能重叠的伪随机数序列。

此视频更详细地解释了原因:

http://software.intel.com/en-us/videos/tim-mattson-use-and-abuse-of-random-numbers/

如果你想要真正的随机数,那么你真的需要使用加密随机数生成器System.Security.Cryptography.RNGCryptoServiceProvider。这是线程安全的。

答案 2 :(得分:1)

一个核心问题:

  • random.Next不是线程安全的。

两个后果:

  1. 竞争条件会破坏随机性的质量。
  2. 虚假共享破坏了多核的可扩展性。
  3. 几种可能的解决方案:

    • 使random.Next线程安全:解决质量问题,但不能扩展性。
    • 使用多个PRNG:解决了可扩展性问题,但可能会降低质量。
    • ...