Question

为了模拟的目的，我使用rand()函数生成0,1之间的伪随机数，但是当我决定让我的C ++代码并行运行时（通过OpenMP），我注意到rand()不是线程安全的，也不是很均匀。

所以我转而使用（所谓的）更均匀的生成器，在许多答案中提出了其他问题。看起来像这样

double rnd(const double & min, const double & max) {
    static thread_local mt19937* generator = nullptr;
    if (!generator) generator = new mt19937(clock() + omp_get_thread_num());
    uniform_real_distribution<double> distribution(min, max);
    return fabs(distribution(*generator));
}

但是我在我模拟的原始问题中看到了许多科学错误。这些问题既反对rand()的结果，也反对常识。

所以我写了一个用这个函数生成500k随机数的代码，计算它们的平均值并做了200次并绘制结果。

double SUM=0;
for(r=0; r<=10; r+=0.05){   
    #pragma omp parallel for ordered schedule(static)
    for(w=1; w<=500000; w++){   
        double a;
        a=rnd(0,1);
        SUM=SUM+a;
    } 
    SUM=SUM/w_max;
    ft<<r<<'\t'<<SUM<<'\n';
    SUM=0;
}

我们知道如果不是500k我可以无限次地做它，它应该是一个值为0.5的简单线。但是有了500k，我们的波动将在0.5左右。

使用单个线程运行代码时，结果是可以接受的：

但这是2个主题的结果：

3个主题：

4个主题：

我现在没有我的8线程CPU，但结果甚至值得。

正如你所看到的，它们都不均匀，并且在平均值附近波动很大。

这个伪随机生成器线程也不安全吗？

或者我在某处犯了错误？

Answer 1

我将对您的测试输出进行三次观察：

它的差异比一个好的随机源平均值应该提供的差异强得多。您通过与单线程结果进行比较来自行观察。
计算出的平均值随线程数减少而从未达到原来的0.5（即它不仅仅是更高的方差，而且还改变了平均值）。
数据中存在时间关系，特别是在4线程案例中可见。

所有这些都可以通过代码中存在的竞争条件来解释：您从多个线程分配给SUM。增加double不是原子操作（即使在x86上，你可能会在寄存器上获得原子读写）。两个线程可以读取当前值（例如10），递增它（例如，两者都加0.5），然后将值写回存储器。现在你有两个线程写10.5而不是正确的11。

越多线程尝试同时写入SUM（没有同步），他们的更改就会丢失得越多。这解释了所有观察结果：

线程在每次单独运行中相互竞争的难度决定了丢失的结果数量，这可能因运行而异。
随着更多比赛（例如更多线程），平均值会降低，因为会丢失更多结果。你永远不会超过统计0.5的平均值，因为你只会丢失写作。
随着线程和调度程序＆＃34;在＃34;中，方差减少。这就是为什么你应该热身＆＃34;基准测试时的测试。

毋庸置疑，这是未定义的行为。它只显示x86 CPU上的良性行为，但这不是C ++标准保证的。如你所知，double的各个字节可能会被不同的线程同时写入，导致完全垃圾。

正确的解决方案是在本地添加双线程，然后（同步）将它们最终添加到一起。 OMP为此特定目的有减少条款。

对于整数类型，您可以使用std::atomic<IntegralType>::fetch_add()。 std::atomic<double>存在，但（在C ++ 20之前）所提到的函数（和其他函数）仅适用于整数类型。

Answer 2

问题不在你的RNG中，而在于你的总和。 SUM上只有竞争条件。要解决此问题，请使用缩减，例如将编译指示更改为：

#pragma omp parallel for ordered schedule(static) reduction(+:SUM)

请注意，在OpenMP中使用thread_local在技术上是未定义的行为。它可能在实践中起作用，但是OpenMP和C ++ 11线程概念之间的交互没有很好地定义（另见this question）。因此，安全的OpenMP替代方案将是：

static mt19937* generator = nullptr;
#pragma omp threadprivate(generator)

为什么这个随机数生成器不是线程安全的？

2 个答案: