std :: mt19937_64比std :: mt19937更快吗?

时间:2016-08-25 20:50:06

标签: c++ random

假设64位架构,mt19937_64的吞吐量(bit / s)是否高于32位版本mt19937

矢量化后怎么样?

2 个答案:

答案 0 :(得分:5)

这显然取决于您的编译器及其实现。我刚刚测试过,64位版本的呼叫呼叫时间长了大约60%,这使得64位版本的比特速度提高了约25%。我用i7 cpu进行了测试。

如果您需要最高速度,您可能需要考虑使用其他东西。特别是如果数字不需要非常高的质量。

答案 1 :(得分:3)

正如@byjoe所指出的,这显然取决于编译器。

在这种情况下,它似乎相当于更多依赖于编译器而不是典型的。例如,注释中链接的Boost测试使用VC ++ 2010中的编译器,并且显示使用mt19937_64时每秒随机位数的增加相当小。

为了获得更多最新信息,我提出了一个简单的测试:

#include <random>
#include <chrono>
#include <iostream>
#include <iomanip>

template <class T, class U>
U test(char const *label, U count) {
    using namespace std::chrono;
    T gen(100);

    U result = 0;

    auto start = high_resolution_clock::now();
    for (U i = 0; i < count; i++)
        result ^= gen();
    auto stop = high_resolution_clock::now();
    std::cout << "Time for " << std::left << std::setw(12) << label
        << duration_cast<milliseconds>(stop - start).count() << "\n";
    return result;
}

int main(int argc, char **argv) {
    unsigned long long limit = 1000000000;

    auto result1 = test<std::mt19937>("mt19937: ", limit);
    auto result2 = test<std::mt19937_64>("mt19937_64: ", limit);

    std::cout << "Ignore: " << result1 << ", " << result2 << "\n";
}

使用VC ++ 2015 udpate 3(使用/ o2b2 / GL,虽然它可能无关紧要),我得到的结果如下:

Time for mt19937:    4339
Time for mt19937_64: 4215
Ignore: 2598366015, 13977046647333287932

这表明mt19937_64每次调用的速度稍快,因此每位的速度是mt19937的两倍。使用MinGW(使用-O3),结果更像是与Boost网站链接的结果:

Time for mt19937:    2211
Time for mt19937_64: 4183
Ignore: 2598366015, 13977046647333287932

在这种情况下,mt19937_64只需要少于每次调用时间的两倍,因此每位只有稍快一点。最高的整体速度似乎来自g ++和mt19937_64,但g ++和VC ++(在这些运行中)之间的差异小于1%,所以我不确定它是否可重现。

对于它的价值,mt19937和mt19937_64与VC ++之间的速度(每次通话)的差异也很小,但似乎是可重现的 - 它在我的测试中发生得非常一致。我确实想知道这是否(至少部分地)是时钟管理的问题 - 当代码第一次启动时,CPU处于空闲状态,并且时钟已经减慢,所以第一次运行的第一部分是在降低时钟速度。为了检查,我颠倒了顺序以首先测试mt19937_64。我认为我的假设至少是部分正确的 - 当我颠倒顺序时,mt19937_64与mt19937相比放慢了速度,因此它们在VC ++的每次通话基础上几乎相同。