构造符号的双重发射

时间:2011-08-03 03:22:14

标签: c++ gcc constructor

今天,我发现有关g++nm的一个相当有趣的事情......构造函数定义似乎在库中有两个条目。

我有一个标题thing.hpp

class Thing
{
    Thing();

    Thing(int x);

    void foo();
};

thing.cpp

#include "thing.hpp"

Thing::Thing()
{ }

Thing::Thing(int x)
{ }

void Thing::foo()
{ }

我用以下代码编译:

g++ thing.cpp -c -o libthing.a

然后,我在其上运行nm

%> nm -gC libthing.a
0000000000000030 T Thing::foo()
0000000000000022 T Thing::Thing(int)
000000000000000a T Thing::Thing()
0000000000000014 T Thing::Thing(int)
0000000000000000 T Thing::Thing()
                 U __gxx_personality_v0

如您所见,Thing的两个构造函数都在生成的静态库中列出了两个条目。我的g++是4.4.3,但同样的行为发生在clang中,因此它不仅仅是gcc问题。

这不会引起任何明显的问题,但我想知道:

  • 为什么定义的构造函数列出两次?
  • 为什么这不会导致“符号__的多重定义”问题?

编辑:对于Carl,没有C参数的输出:

%> nm -g libthing.a
0000000000000030 T _ZN5Thing3fooEv
0000000000000022 T _ZN5ThingC1Ei
000000000000000a T _ZN5ThingC1Ev
0000000000000014 T _ZN5ThingC2Ei
0000000000000000 T _ZN5ThingC2Ev
                 U __gxx_personality_v0

正如你所看到的......同样的功能产生了多个符号,这仍然很奇怪。

虽然我们在这里,但这是生成的汇编的一部分:

.globl _ZN5ThingC2Ev
        .type   _ZN5ThingC2Ev, @function
_ZN5ThingC2Ev:
.LFB1:
        .cfi_startproc
        .cfi_personality 0x3,__gxx_personality_v0
        pushq   %rbp
        .cfi_def_cfa_offset 16
        movq    %rsp, %rbp
        .cfi_offset 6, -16
        .cfi_def_cfa_register 6
        movq    %rdi, -8(%rbp)
        leave
        ret
        .cfi_endproc
.LFE1:
        .size   _ZN5ThingC2Ev, .-_ZN5ThingC2Ev
        .align 2
.globl _ZN5ThingC1Ev
        .type   _ZN5ThingC1Ev, @function
_ZN5ThingC1Ev:
.LFB2:
        .cfi_startproc
        .cfi_personality 0x3,__gxx_personality_v0
        pushq   %rbp
        .cfi_def_cfa_offset 16
        movq    %rsp, %rbp
        .cfi_offset 6, -16
        .cfi_def_cfa_register 6
        movq    %rdi, -8(%rbp)
        leave
        ret
        .cfi_endproc

所以生成的代码是......好......相同。


编辑:要查看实际调用的构造函数,我将Thing::foo()更改为:

void Thing::foo()
{
    Thing t;
}

生成的程序集是:

.globl _ZN5Thing3fooEv
        .type   _ZN5Thing3fooEv, @function
_ZN5Thing3fooEv:
.LFB550:
        .cfi_startproc
        .cfi_personality 0x3,__gxx_personality_v0
        pushq   %rbp
        .cfi_def_cfa_offset 16
        movq    %rsp, %rbp
        .cfi_offset 6, -16
        .cfi_def_cfa_register 6
        subq    $48, %rsp
        movq    %rdi, -40(%rbp)
        leaq    -32(%rbp), %rax
        movq    %rax, %rdi
        call    _ZN5ThingC1Ev
        leaq    -32(%rbp), %rax
        movq    %rax, %rdi
        call    _ZN5ThingD1Ev
        leave
        ret
        .cfi_endproc

所以它调用了完整的对象构造函数。

1 个答案:

答案 0 :(得分:125)

我们首先声明GCC follows the Itanium C++ ABI


根据ABI,您Thing::foo()的错位名称很容易解析:

_Z     | N      | 5Thing  | 3foo | E          | v
prefix | nested | `Thing` | `foo`| end nested | parameters: `void`

您可以类似地阅读构造函数名称,如下所示。请注意如何给出构造函数“name”,而不是C子句:

_Z     | N      | 5Thing  | C1          | E          | i
prefix | nested | `Thing` | Constructor | end nested | parameters: `int`

但这是什么C1?您的副本有C2。这意味着什么

好吧,this is quite simple too

  <ctor-dtor-name> ::= C1   # complete object constructor
                   ::= C2   # base object constructor
                   ::= C3   # complete object allocating constructor
                   ::= D0   # deleting destructor
                   ::= D1   # complete object destructor
                   ::= D2   # base object destructor

等等,为什么简单?这个班没有基础。为什么每个都有一个“完整对象构造函数”一个“基础对象构造函数”?

  • This Q&A向我暗示,这只是多态支持的副产品,即使在这种情况下实际上并不需要。

  • 请注意,c++filt过去曾在其解码输出but doesn't any more中包含此信息。

  • This forum post提出同样的问题,唯一的答案在回答它时没有做得更好,除了GCC 可能避免在多态性时发出两个构造函数的暗示没有参与,这种行为将来应该得到改善。

  • This newsgroup posting描述了由于这种双重发射而在构造函数中设置断点的问题。再次声明问题的根源是对多态性的支持。

事实上,this is listed as a GCC "known issue"

  

G ++发出两个构造函数和析构函数副本。

     

一般来说,有三种类型的构造函数(和   析)。

     
      
  • 完整的对象构造函数/析构函数。
  •   
  • 基础对象构造函数/析构函数。
  •   
  • 分配构造函数/解除分析析构函数。
  •   
     

当虚拟基类是时,前两个是不同的   参与。


这些不同构造函数的含义seems to be as follows

  • “完整对象构造函数”。它还构建了虚拟基类。

  • “基础对象构造函数”。它创建了对象本身,以及数据成员和非虚拟基类。

  • “分配对象构造函数”。它完成了完整对象构造函数所做的所有事情,并且它调用operator new来实际分配内存... 但显然通常不会看到它。

  

如果你没有虚拟基类,[前两个]是   相同; GCC将在足够的优化级别上实际上是别名   两个符号都是相同的代码。