我刚开始玩任务并行库,遇到了有趣的问题;我对将要发生的事情有一个大概的了解,但是希望听到比我更有能力帮助理解正在发生的事情的人的评论。我为有点冗长的代码道歉。
我开始使用随机游走的非并行模拟:
var random = new Random();
Stopwatch stopwatch = new Stopwatch();
stopwatch.Start();
var simulations = new List<int>();
for (var run = 0; run < 20; run++)
{
var position = 0;
for (var step = 0; step < 10000000; step++)
{
if (random.Next(0, 2) == 0)
{
position--;
}
else
{
position++;
}
}
Console.WriteLine(string.Format("Terminated run {0} at position {1}.", run, position));
simulations.Add(position);
}
Console.WriteLine(string.Format("Average position: {0} .", simulations.Average()));
stopwatch.Stop();
Console.WriteLine(string.Format("Time elapsed: {0}", stopwatch.ElapsedMilliseconds));
Console.ReadLine();
然后我在并行循环中写了我的第一次尝试:
var localRandom = new Random();
stopwatch.Reset();
stopwatch.Start();
var parallelSimulations = new List<int>();
Parallel.For(0, 20, run =>
{
var position = 0;
for (var step = 0; step < 10000000; step++)
{
if (localRandom.Next(0, 2) == 0)
{
position--;
}
else
{
position++;
}
}
Console.WriteLine(string.Format("Terminated run {0} at position {1}.", run, position));
parallelSimulations.Add(position);
});
Console.WriteLine(string.Format("Average position: {0} .", parallelSimulations.Average()));
stopwatch.Stop();
Console.WriteLine(string.Format("Time elapsed: {0}", stopwatch.ElapsedMilliseconds));
Console.ReadLine();
当我在设置为仅使用1个核心的虚拟机上运行它时,我观察到了相似的持续时间,但运行不再按顺序处理 - 毫不奇怪。
当我在双核机器上运行时,事情变得奇怪了。我没有看到任何时间的改进,并且每次运行都观察到一些非常奇怪的结果。大多数运行最终结果为-1,000,000(或非常接近),这表明Random.Next一直返回0准。
当我为每个循环制作随机局部时,一切正常,我得到了预期的持续时间改进:
Parallel.For(0, 20, run =>
{
var localRandom = new Random();
var position = 0;
我的猜测是问题与Random对象在循环之间共享并且具有某种状态这一事实有关。 “失败并行”版本的持续时间缺乏改善是我假设由于没有并行处理对Random的调用这一事实(即使我看到并行版本使用两个核心,而原始版本没有) 。我真正没有得到的部分是为什么模拟结果是它们的原因。
我有一个单独的担心是,如果我在每个循环中使用局部的Random实例,我可能会遇到以同一种子开头的多个循环的问题(当你生成多个Random时,你得到的问题,导致相同的序列)。
对正在发生的事情的任何见解对我来说都是非常有价值的!
答案 0 :(得分:2)
Random
类不是线程安全的;如果你在多个线程上使用它,它可能会搞砸。
您应该在每个线程上创建一个单独的Random
实例,并确保它们最终不会使用相同的种子。 (例如,Environment.TickCount * Thread.CurrentThread.ManagedThreadId
)
答案 1 :(得分:2)
这些方法都不会给你真正好的随机数。
此博客文章介绍了使用Random
获取更好的随机数的许多方法http://blogs.msdn.com/b/pfxteam/archive/2009/02/19/9434171.aspx
这些可能适用于许多日常应用。
但是,如果您在多个线程上使用相同的随机数生成器,即使使用不同的种子,您仍然会影响随机数的质量。这是因为您正在生成可能重叠的伪随机数序列。
此视频更详细地解释了原因:
http://software.intel.com/en-us/videos/tim-mattson-use-and-abuse-of-random-numbers/
如果你想要真正的随机数,那么你真的需要使用加密随机数生成器System.Security.Cryptography.RNGCryptoServiceProvider。这是线程安全的。
答案 2 :(得分:1)
一个核心问题:
random.Next
不是线程安全的。两个后果:
几种可能的解决方案:
random.Next
线程安全:解决质量问题,但不能扩展性。