简单。快速比较两个800k每个元素数组

时间:2016-02-07 14:43:44

标签: c++

使用mt19937_64生成器我生成800到000 000的整数。每个数字必须是唯一的,所以我应该将它与每个已生成的整数进行比较:

unsigned array[800 000]; 
for (int i = 0; i < 800 000; i++)
  {
    generate_again:      
    buffer = uid(rng); // generate in buffer

    for (int j = 0; j < i; j++) // *comparing to every already generated integer
      {
        if (buffer == array[j])
          goto generate_again; // if the same integer exist, go togenerate_again flag
      }
      array[i] = pepper; // is integer is unique - it goes to array.
  }

此比较大约需要16分钟。我怎么能更快地做到这一点?感谢。

3 个答案:

答案 0 :(得分:2)

您可以先按顺序生成唯一的数字,然后将它们随机播放以获得最终结果(如果您需要的话)。

如果已经生成了值,则使用std::bitset将是一种有效的存储方式。或者,如果您在编译时实际上并不知道值的数量,则可以使用std::vector<bool>这是一个使用位操作的特化,也可以节省一些空间。

#include <iostream>

#include <vector>
#include <algorithm>
#include <random>
#include <bitset>


int main()
{
    static constexpr int max_value = 30'000'000;
    static constexpr int n_values = 800'000;

    std::bitset<max_value + 1> have_num;

    int cur_n_values = 0;

    std::mt19937_64 mt{std::random_device{}()};
    std::uniform_int_distribution<int> distribution{0, max_value};


    while (cur_n_values != n_values) {
        auto newVal = distribution(mt);

        if (!have_num[newVal]) {
            have_num[newVal] = true;
            ++cur_n_values;
        }
    }

    std::vector<int> nums;
    nums.reserve(n_values);

    for (int i = 0; i < have_num.size(); ++i) {
        if (have_num[i]) {
            nums.push_back(i);
        }
    }

    std::shuffle(nums.begin(), nums.end(), mt);

    for (auto i : nums) {
        std::cout << i << " ";
    }
}

LIVE

答案 1 :(得分:1)

如果您不需要生成数组,请检查唯一性并删除元素 - 仅存储唯一数字。

尝试使用hashed_unique boost::multiindex。 如果您想保留订单,请使用ordered_unique

另请参阅:this

答案 2 :(得分:1)

首先通过循环遍历数组来消除检查。如果您只有30E6变体,如果有足够的空间,可以尝试将它们放在一个布尔标志数组中。那将花费大约30Mb。存储器的另一优化可以是将标志打包到位掩码。这将花费少8倍。它会提高速度。因此,如果有30Mb / 8(~4Mb)大小的标志数组,您可以在恒定时间内检查已生成数字的存在。这将大大提高速度。但是还有另外一个问题:有很多代人会遇到反复碰撞。