矢量中最快的擦除元素或更好地使用内存(排序基数)

时间:2017-03-15 20:49:53

标签: c++ stdvector radix-sort

我遇到了麻烦,我使用基数排序算法创建了一个实现,但我认为我可以使用更少的内存,而且我可以!但是...我这样做之后使用了擦除矢量的元素。问题:执行3分钟vs 17秒。怎么擦除元素?或者...如何更好地使用内存。

sort.hpp

#include <iostream>

#include <vector>
#include <algorithm>

unsigned digits_counter(long long unsigned x);

void radix( std::vector<unsigned> &vec )
{
  unsigned size = vec.size();
  if(size == 0);
  else {
    unsigned int max = *max_element(vec.begin(), vec.end());
    unsigned int digits = digits_counter( max );

    // FOR EVERY 10 POWER...
    for (unsigned i = 0; i < digits; i++) {
      std::vector < std::vector <unsigned>  > base(10, std::vector <unsigned> ());

#ifdef ERASE
      // GET EVERY NUMBER IN THE VECTOR AND
      for (unsigned j = 0; j < size; j++) {
    unsigned int digit = vec[0];

    // GET THE DIGIT FROM POSITION "i" OF THE NUMBER vec[j]
    for (unsigned k = 0; k < i; k++)
      digit /= 10;
    digit %= 10;

    // AND PUSH NUMBER IN HIS BASE BUCKET
    base[ digit ].push_back( vec[0] );
    vec.erase(vec.begin());
      }

#else
      // GET EVERY NUMBER IN THE VECTOR AND
      for (unsigned j = 0; j < size; j++) {
    unsigned int digit = vec[j];

    // GET THE DIGIT FROM POSITION "i" OF THE NUMBER vec[j]
    for (unsigned k = 0; k < i; k++)
      digit /= 10;
    digit %= 10;

    // AND PUSH NUMBER IN HIS BASE BUCKET
    base[ digit ].push_back( vec[j] );
      }
      vec.erase(vec.begin(), vec.end()); 
#endif

      for (unsigned j = 0; j < 10; j++)
    for (unsigned k = 0; k < base[j].size(); k++)
      vec.push_back( base[j][k] );
    }
  }
}


void fancy_sort( std::vector <unsigned> &v ) {
  if( v.size() <= 1 )
    return;
  if( v.size() == 2 ) {
    if (v.front() >= v.back())
      std::swap(v.front(), v.back());
    return;
  }
  radix(v);
}

sort.cpp

#include <vector>

#include "sort.hpp"

using namespace std;

int main(void)
{
  vector <unsigned> vec;

  vec.resize(rand()%10000);

  for (unsigned j = 0; j < 10000; j++) {
    for (unsigned int i = 0; i < vec.size(); i++)
      vec[i] = rand() % 100;
    fancy_sort(vec);
  }


  return 0;
}

我只是在学习......这是Deitel C ++的第二章。所以...如果有人有更复杂的解决方案......我可以学习如何使用它,困难并不重要。

结果 没有擦除:

g++ -O3 -Wall sort.cpp && time ./a.out
./a.out  2.93s user 0.00s system 98% cpu 2.964 total

擦除:

g++ -D ERASE -O3 -Wall sort.cpp && time ./a.out
./a.out  134.64s user 0.06s system 99% cpu 2:15.20 total

1 个答案:

答案 0 :(得分:1)

std::vector不会删除部分内容。这是你必须忍受的事实。您在速度和内存使用之间的交易是一个经典问题。对于矢量,任何移除(除了从其末端)都是昂贵的并且是浪费。这是因为每次删除元素时,程序都必须在内部重新分配数组,或者必须移动所有元素以填充空白。如果你继续使用矢量,这是你永远无法克服的最终限制。

您问题的向量:快但内存使用量很大。

另一个(可能)最佳极端(记忆方式)是std::list,在任何地方删除任何东西都绝对没有问题。另一方面,访问元素只能通过将整个列表迭代到元素来实现,因为它基本上是doubly-linked list,并且您无法通过其编号访问元素。

列出了您的问题:最佳内存使用率,但速度很慢,因为访问列表元素的速度很慢。

最后,中间理由是std::deque。它们提供了矢量和列表之间的中间地带。它们在记忆中并不连续,但物品可以通过它们的数字找到。从中间移除元素并不一定会导致向量中的相同破坏。 Read this了解有关他们的更多信息。

请求解决您的问题:中间地点,取决于问题,可能对内存和访问速度都很快。

如果记忆是你最关心的问题,那么一定要选择列表。这是最快的。如果您想要最通用的解决方案,请使用deque。也不要忽略将整个数组复制到另一个容器,对其进行排序,然后将其复制回来的可能性。根据数组的大小,这可能会有所帮助。