使用mt19937_64生成器我生成800到000 000的整数。每个数字必须是唯一的,所以我应该将它与每个已生成的整数进行比较:
unsigned array[800 000];
for (int i = 0; i < 800 000; i++)
{
generate_again:
buffer = uid(rng); // generate in buffer
for (int j = 0; j < i; j++) // *comparing to every already generated integer
{
if (buffer == array[j])
goto generate_again; // if the same integer exist, go togenerate_again flag
}
array[i] = pepper; // is integer is unique - it goes to array.
}
此比较大约需要16分钟。我怎么能更快地做到这一点?感谢。
答案 0 :(得分:2)
您可以先按顺序生成唯一的数字,然后将它们随机播放以获得最终结果(如果您需要的话)。
如果已经生成了值,则使用std::bitset
将是一种有效的存储方式。或者,如果您在编译时实际上并不知道值的数量,则可以使用std::vector<bool>
这是一个使用位操作的特化,也可以节省一些空间。
#include <iostream>
#include <vector>
#include <algorithm>
#include <random>
#include <bitset>
int main()
{
static constexpr int max_value = 30'000'000;
static constexpr int n_values = 800'000;
std::bitset<max_value + 1> have_num;
int cur_n_values = 0;
std::mt19937_64 mt{std::random_device{}()};
std::uniform_int_distribution<int> distribution{0, max_value};
while (cur_n_values != n_values) {
auto newVal = distribution(mt);
if (!have_num[newVal]) {
have_num[newVal] = true;
++cur_n_values;
}
}
std::vector<int> nums;
nums.reserve(n_values);
for (int i = 0; i < have_num.size(); ++i) {
if (have_num[i]) {
nums.push_back(i);
}
}
std::shuffle(nums.begin(), nums.end(), mt);
for (auto i : nums) {
std::cout << i << " ";
}
}
答案 1 :(得分:1)
如果您不需要生成数组,请检查唯一性并删除元素 - 仅存储唯一数字。
尝试使用hashed_unique
boost::multiindex。
如果您想保留订单,请使用ordered_unique
。
另请参阅:this
答案 2 :(得分:1)
首先通过循环遍历数组来消除检查。如果您只有30E6变体,如果有足够的空间,可以尝试将它们放在一个布尔标志数组中。那将花费大约30Mb。存储器的另一优化可以是将标志打包到位掩码。这将花费少8倍。它会提高速度。因此,如果有30Mb / 8(~4Mb)大小的标志数组,您可以在恒定时间内检查已生成数字的存在。这将大大提高速度。但是还有另外一个问题:有很多代人会遇到反复碰撞。