*不*初始化其成员的C ++向量?

时间:2012-06-22 03:04:25

标签: c++ stl vector

我正在为一段返回大型数组的C代码制作一个C ++包装器,所以我试图在vector<unsigned char>中返回数据。

现在的问题是,数据大约为兆字节vector不必要地初始化其存储空间,这实际上是为了减少我的存储空间加快一半。

如何防止这种情况?

或者,如果不可能 - 是否有其他STL容器可以避免这种不必要的工作?或者我最终必须制作自己的容器?

(预C ++ 11)

注意:

我将矢量作为输出缓冲区传递。我从其他地方复制数据 它类似于:

vector<unsigned char> buf(size);   // Why initialize??
GetMyDataFromC(&buf[0], buf.size());

5 个答案:

答案 0 :(得分:55)

对于使用用户提供的默认构造函数的结构的默认值和值初始化,这些构造函数没有显式初始化任何内容,因此不对未签名的char成员执行初始化:

struct uninitialized_char {
    unsigned char m;
    uninitialized_char() {}
};

// just to be safe
static_assert(1 == sizeof(uninitialized_char), "");

std::vector<uninitialized_char> v(4 * (1<<20));

GetMyDataFromC(reinterpret_cast<unsigned char*>(&v[0]), v.size());

我认为在严格的别名规则下这甚至是合法的。

当我比较vvector<unsigned char>的构造时间时,我得到~8μsvs~12 ms。速度提高了1000多倍。编译器是使用libc ++和flags -std=c++11 -Os -fcatch-undefined-behavior -ftrapv -pedantic -Weverything -Wno-c++98-compat -Wno-c++98-compat-pedantic -Wno-missing-prototypes

进行的

C ++ 11有一个未初始化存储的帮助器,std :: aligned_storage。虽然它需要编译时间大小。


这是一个增加的例子,用于比较总使用量(以纳秒为单位的时间):

VERSION = 1(vector<unsigned char>):

clang++ -std=c++14 -stdlib=libc++ main.cpp -DVERSION=1 -ftrapv -Weverything -Wno-c++98-compat -Wno-sign-conversion -Wno-sign-compare -Os && ./a.out

initialization+first use: 16,425,554
array initialization: 12,228,039
first use: 4,197,515
second use: 4,404,043

VERSION = 2(vector<uninitialized_char>):

clang++ -std=c++14 -stdlib=libc++ main.cpp -DVERSION=2 -ftrapv -Weverything -Wno-c++98-compat -Wno-sign-conversion -Wno-sign-compare -Os && ./a.out

initialization+first use: 7,523,216
array initialization: 12,782
first use: 7,510,434
second use: 4,155,241


#include <iostream>
#include <chrono>
#include <vector>

struct uninitialized_char {
  unsigned char c;
  uninitialized_char() {}
};

void foo(unsigned char *c, int size) {
  for (int i = 0; i < size; ++i) {
    c[i] = '\0';
  }
}

int main() {
  auto start = std::chrono::steady_clock::now();

#if VERSION==1
  using element_type = unsigned char;
#elif VERSION==2
  using element_type = uninitialized_char;
#endif

  std::vector<element_type> v(4 * (1<<20));

  auto end = std::chrono::steady_clock::now();

  foo(reinterpret_cast<unsigned char*>(v.data()), v.size());

  auto end2 = std::chrono::steady_clock::now();

  foo(reinterpret_cast<unsigned char*>(v.data()), v.size());

  auto end3 = std::chrono::steady_clock::now();

  std::cout.imbue(std::locale(""));
  std::cout << "initialization+first use: " << std::chrono::nanoseconds(end2-start).count() << '\n';
  std::cout << "array initialization: " << std::chrono::nanoseconds(end-start).count() << '\n';
  std::cout << "first use: " << std::chrono::nanoseconds(end2-end).count() << '\n';
  std::cout << "second use: " << std::chrono::nanoseconds(end3-end2).count() << '\n';
}

我正在使用clang svn-3.6.0 r218006

答案 1 :(得分:8)

抱歉,没有办法避免它。

C ++ 11添加了一个只占用一个大小的构造函数,但即使这样也会对数据进行值初始化。

最好的办法是在堆上分配一个数组,将其粘贴在unique_ptr(如果可用)中,然后从那里使用它。

如果你愿意,正如你所说,“黑客入侵STL”,你总是可以抓住copy of EASTL来工作。它是某些STL容器的变体,允许更多受限的内存条件。正确实现你想要做的是给它的构造函数一个特殊的值,意思是“默认初始化成员”,对于POD类型来说意味着什么都不做初始化内存。当然,这需要使用一些模板元编程来检测它是否是POD类型。

答案 2 :(得分:3)

1 似乎在你的情况下使用std::vector并不是必须的。您只需要一些对象来为您管理一些原始内存。这可以通过

轻松实现
std::unique_ptr<void, void(*)(void*)> p(std::malloc(n), std::free);

2 如果您真的想使用std::vector<>,可以使用here所述的技巧。

答案 3 :(得分:2)

最佳解决方案是简单地将分配器更改为零参数construct不执行任何操作。这意味着底层类型是相同的,它可以避免任何类型的令人讨厌的reinterpret_casting和潜在的别名违规,并且可以非侵入性地取消初始化任何类型。

template<typename T> struct no_initialize : std::allocator<T> {
    void construct(T* p) {}
    template<typename... Args> void construct(T* p, Args&&... args) {
        new (p) T(std::forward<Args>(args)...);
    }
};

答案 4 :(得分:-1)

如何使用vector.reserve()仅分配存储但不初始化它?