Question

这是来自Efficient way to return a std::vector in c++

的扩展问题

#include <cstdio>
#include <vector>
#include <chrono>

std::vector<int> func1() {
    std::vector<int> v;
    v.reserve(1e6);
    for (int i = 0; i < 1e6; i++) v.emplace_back(i);
    return v;
}

std::vector<int> func2() {
    std::vector<int> v;
    v.reserve(1e6);
    for (int i = 0; i < 1e6; i++) v.emplace_back(i);
    return std::move(v);
}

int main() {
    auto start1 = std::chrono::steady_clock::now();
    std::vector<int> v1 = func1();
    auto end1 = std::chrono::steady_clock::now();
    printf("%d\n", std::chrono::duration_cast<std::chrono::nanoseconds>(end1-start1).count());

    auto start2 = std::chrono::steady_clock::now();
    std::vector<int> v2 = func2();
    auto end2 = std::chrono::steady_clock::now();
    printf("%d\n", std::chrono::duration_cast<std::chrono::nanoseconds>(end2-start2).count());

/*
    auto start3 = std::chrono::steady_clock::now();
    std::vector<int> v3 = v2;
    auto end3 = std::chrono::steady_clock::now();
    printf("%d\n", std::chrono::duration_cast<std::chrono::nanoseconds>(end3-start3).count());
*/

    return 0;
}

在方法2中，我明确告诉编译器我要移动而不是复制向量，但多次运行代码表明方法1实际上有时胜过方法2，即使方法2获胜，也不是很多

方法3始终是最好的。当我必须从函数返回时如何模拟方法3？（不，我不能通过参考传递）

使用gcc 6.1.0

Answer 1

方法1 - 您正在使用Named Return Value Optimization (NRVO)。实际上，这是最好的，因为在优化的代码中根本没有构造临时对象。如果编译器无法生成NRVO，它将使用移动语义，与方法2相同。

方法2 - 您实际上正在关闭NRVO，并强制移动目标std :: vector的构造函数。因此，这不如方法1那么好。

方法3 - 实际上，你在这里复制矢量，这是迄今为止最糟糕的表现。但是，由于您在一次传递中复制了矢量（一个大块的内存，而不是很多的内容） - 您获得了最佳性能，但在方法1或2的用例中这不可复制。

NRVO如何运作？如果只有一个返回值：在这种情况下，这是std::vector<int> v，编译器根本不在函数内部创建此向量。它会创建未命名的右值向量，您将返回该向量，并将对它的引用传递给您的函数。

这样的事情将在优化的代码中发生：

std::vector<int> func1(std::vector<int>& hidden) {
     hidden.emplace_back(stuff);
     return;
}

从函数返回stl向量的有效方法

1 个答案: