假设64位架构,mt19937_64
的吞吐量(bit / s)是否高于32位版本mt19937
?
矢量化后怎么样?
答案 0 :(得分:5)
这显然取决于您的编译器及其实现。我刚刚测试过,64位版本的呼叫呼叫时间长了大约60%,这使得64位版本的比特速度提高了约25%。我用i7 cpu进行了测试。
如果您需要最高速度,您可能需要考虑使用其他东西。特别是如果数字不需要非常高的质量。
答案 1 :(得分:3)
正如@byjoe所指出的,这显然取决于编译器。
在这种情况下,它似乎相当于更多依赖于编译器而不是典型的。例如,注释中链接的Boost测试使用VC ++ 2010中的编译器,并且显示使用mt19937_64时每秒随机位数的增加相当小。
为了获得更多最新信息,我提出了一个简单的测试:
#include <random>
#include <chrono>
#include <iostream>
#include <iomanip>
template <class T, class U>
U test(char const *label, U count) {
using namespace std::chrono;
T gen(100);
U result = 0;
auto start = high_resolution_clock::now();
for (U i = 0; i < count; i++)
result ^= gen();
auto stop = high_resolution_clock::now();
std::cout << "Time for " << std::left << std::setw(12) << label
<< duration_cast<milliseconds>(stop - start).count() << "\n";
return result;
}
int main(int argc, char **argv) {
unsigned long long limit = 1000000000;
auto result1 = test<std::mt19937>("mt19937: ", limit);
auto result2 = test<std::mt19937_64>("mt19937_64: ", limit);
std::cout << "Ignore: " << result1 << ", " << result2 << "\n";
}
使用VC ++ 2015 udpate 3(使用/ o2b2 / GL,虽然它可能无关紧要),我得到的结果如下:
Time for mt19937: 4339
Time for mt19937_64: 4215
Ignore: 2598366015, 13977046647333287932
这表明mt19937_64每次调用的速度稍快,因此每位的速度是mt19937的两倍。使用MinGW(使用-O3),结果更像是与Boost网站链接的结果:
Time for mt19937: 2211
Time for mt19937_64: 4183
Ignore: 2598366015, 13977046647333287932
在这种情况下,mt19937_64只需要少于每次调用时间的两倍,因此每位只有稍快一点。最高的整体速度似乎来自g ++和mt19937_64,但g ++和VC ++(在这些运行中)之间的差异小于1%,所以我不确定它是否可重现。
对于它的价值,mt19937和mt19937_64与VC ++之间的速度(每次通话)的差异也很小,但似乎是可重现的 - 它在我的测试中发生得非常一致。我确实想知道这是否(至少部分地)是时钟管理的问题 - 当代码第一次启动时,CPU处于空闲状态,并且时钟已经减慢,所以第一次运行的第一部分是在降低时钟速度。为了检查,我颠倒了顺序以首先测试mt19937_64。我认为我的假设至少是部分正确的 - 当我颠倒顺序时,mt19937_64与mt19937相比放慢了速度,因此它们在VC ++的每次通话基础上几乎相同。