编译器是否可以删除以下副本?

时间:2011-05-26 13:22:54

标签: c++ copy-elision

我仍然是一名新手程序员,我知道过早的优化是不好的,但我也知道复制大量的东西也很糟糕。

我已经阅读了复制省略和它的同义词,但维基百科上的例子让我觉得复制省略只有在要完全构建的同时返回要返回的对象时才会发生。

像vector这样的对象怎么样?当用作返回值时,它通常只在填充某些东西时才有意义。 毕竟,可以手动实例化空矢量。

那么,它是否也适用于这样的情况?

简洁的风格:

vector<foo> bar(string baz)
{
    vector<foo> out;
    for (each letter in baz)
        out.push_back(someTable[letter]);

    return out;
}

int main()
{
     vector<foo> oof = bar("Hello World");
}

我使用bar(矢量&amp; out,字符串文本)没有真正的麻烦,但上面的方式看起来会更好,美观和意图。

3 个答案:

答案 0 :(得分:10)

  例如,维基百科上的示例让我觉得只有在要完全构造的同时返回要返回的对象时才能进行复制省略。

这是误导性的(读:错误)。问题是在所有代码路径中只返回一个对象,即只发生潜在返回对象的一个构造。

您的代码很好,任何现代编译器都可以忽略该副本。

另一方面,以下代码可能会产生问题:

vector<int> foo() {
    vector<int> a;
    vector<int> b;
    // … fill both.
    bool c;
    std::cin >> c;
    if (c) return a; else return b;
}

这里,编译器需要完全构造两个不同的对象,只有以后决定返回哪些对象,因此它必须复制一次,因为它不能直接在目标内存中构造返回的对象位置。

答案 1 :(得分:5)

没有什么能阻止编译器删除副本。这在12.8.15中定义:

  

[...]复制操作的省略是   允许以下内容   情况(可以合并   消除多份副本):

     

[...]

     
      
  • 当一个临时类对象有   没有受到参考(12.2)   将被复制到一个类对象   相同的cv-unqualified类型,副本   操作可以省略   构造临时对象   直接进入了目标   省略副本
  •   

如果实际上取决于编译器和您使用的设置。

答案 2 :(得分:5)

vector的隐含副本都可以 - 通常是 - 被消除。命名返回值优化可以消除return语句return out;中隐含的副本,并且允许删除oof的副本初始化中隐含的临时值。

通过两种优化,vector<foo> out;中构建的对象与oof构成的对象相同。

使用这样的人工测试案例测试哪些优化更容易。

struct CopyMe
{
    CopyMe();
    CopyMe(const CopyMe& x);
    CopyMe& operator=(const CopyMe& x);

    char data[1024]; // give it some bulk
};

void Mutate(CopyMe&);

CopyMe fn()
{
    CopyMe x;
    Mutate(x);
    return x;
}

int main()
{
    CopyMe y = fn();
    return 0;
}

声明了复制构造函数但未定义复制构造函数,因此无法内联和消除对它的调用。使用现在相对较旧的gcc 4.4进行编译,在-O3 -fno-inline处进行以下汇编(过滤以解码C ++名称并编辑以删除非代码)。

fn():
        pushq   %rbx
        movq    %rdi, %rbx
        call    CopyMe::CopyMe()
        movq    %rbx, %rdi
        call    Mutate(CopyMe&)
        movq    %rbx, %rax
        popq    %rbx
        ret

main:
        subq    $1032, %rsp
        movq    %rsp, %rdi
        call    fn()
        xorl    %eax, %eax
        addq    $1032, %rsp
        ret

可以看出,没有调用复制构造函数。事实上,即使在-O0,gcc也会执行这些优化。您必须提供-fno-elide-constructors才能关闭此行为;如果你这样做,那么gcc会生成两个对CopyMe的复制构造函数的调用 - 一个在fn()的内部,一个在调用之外。

fn():
        movq    %rbx, -16(%rsp)
        movq    %rbp, -8(%rsp)
        subq    $1048, %rsp
        movq    %rdi, %rbx
        movq    %rsp, %rdi
        call    CopyMe::CopyMe()
        movq    %rsp, %rdi
        call    Mutate(CopyMe&)
        movq    %rsp, %rsi
        movq    %rbx, %rdi
        call    CopyMe::CopyMe(CopyMe const&)
        movq    %rbx, %rax
        movq    1040(%rsp), %rbp
        movq    1032(%rsp), %rbx
        addq    $1048, %rsp
        ret

main:
        pushq   %rbx
        subq    $2048, %rsp
        movq    %rsp, %rdi
        call    fn()
        leaq    1024(%rsp), %rdi
        movq    %rsp, %rsi
        call    CopyMe::CopyMe(CopyMe const&)
        xorl    %eax, %eax
        addq    $2048, %rsp
        popq    %rbx
        ret