如何计算ELF文件中的静态初始化程序?

时间:2013-03-20 19:10:02

标签: c++ linux gcc elf

我正在尝试在C ++文件中计算静态初始值设定项。

我已经拥有的解决方案(曾经使用过gcc-4.4)正在查看.ctors ELF部分的大小。

升级到gcc-4.6后,这似乎不再返回有效结果(计算出的静态初始值设定数为0,与实际值不匹配,例如由nm返回)。

现在的问题是,即使没有符号,我也希望解决方案正常工作(否则我会使用nm)。

以下是示例可执行文件的readelf -SW的输出:

有35个节标题,从偏移量0x4f39820开始:

Section Headers:
  [Nr] Name              Type            Addr     Off    Size   ES Flg Lk Inf Al
  [ 0]                   NULL            00000000 000000 000000 00      0   0  0
  [ 1] .interp           PROGBITS        00000174 000174 000013 00   A  0   0  1
  [ 2] .note.ABI-tag     NOTE            00000188 000188 000020 00   A  0   0  4
  [ 3] .note.gnu.build-id NOTE            000001a8 0001a8 000024 00   A  0   0  4
  [ 4] .gnu.hash         GNU_HASH        000001cc 0001cc 000918 04   A  5   0  4
  [ 5] .dynsym           DYNSYM          00000ae4 000ae4 00a5e0 10   A  6   1  4
  [ 6] .dynstr           STRTAB          0000b0c4 00b0c4 00ef72 00   A  0   0  1
  [ 7] .gnu.version      VERSYM          0001a036 01a036 0014bc 02   A  5   0  2
  [ 8] .gnu.version_r    VERNEED         0001b4f4 01b4f4 000450 00   A  6  13  4
  [ 9] .rel.dyn          REL             0001b944 01b944 268480 08   A  5   0  4
  [10] .rel.plt          REL             00283dc4 283dc4 0048c8 08   A  5  12  4
  [11] .init             PROGBITS        0028868c 28868c 00002e 00  AX  0   0  4
  [12] .plt              PROGBITS        002886c0 2886c0 0091a0 04  AX  0   0 16
  [13] .text             PROGBITS        00291860 291860 3ac5638 00  AX  0   0 16
  [14] malloc_hook       PROGBITS        03d56ea0 3d56ea0 00075a 00  AX  0   0 16
  [15] google_malloc     PROGBITS        03d57600 3d57600 008997 00  AX  0   0 16
  [16] .fini             PROGBITS        03d5ff98 3d5ff98 00001a 00  AX  0   0  4
  [17] .rodata           PROGBITS        03d5ffc0 3d5ffc0 ffa640 00   A  0   0 64
  [18] .eh_frame_hdr     PROGBITS        04d5a600 4d5a600 0004b4 00   A  0   0  4
  [19] .eh_frame         PROGBITS        04d5aab4 4d5aab4 001cb8 00   A  0   0  4
  [20] .gcc_except_table PROGBITS        04d5c76c 4d5c76c 0003ab 00   A  0   0  4
  [21] .tbss             NOBITS          04d5df0c 4d5cf0c 000014 00 WAT  0   0  4
  [22] .init_array       INIT_ARRAY      04d5df0c 4d5cf0c 000090 00  WA  0   0  4
  [23] .ctors            PROGBITS        04d5df9c 4d5cf9c 000008 00  WA  0   0  4
  [24] .dtors            PROGBITS        04d5dfa4 4d5cfa4 000008 00  WA  0   0  4
  [25] .jcr              PROGBITS        04d5dfac 4d5cfac 000004 00  WA  0   0  4
  [26] .data.rel.ro      PROGBITS        04d5dfc0 4d5cfc0 1b160c 00  WA  0   0 32
  [27] .dynamic          DYNAMIC         04f0f5cc 4f0e5cc 000220 08  WA  6   0  4
  [28] .got              PROGBITS        04f0f7ec 4f0e7ec 00a800 04  WA  0   0  4
  [29] .data             PROGBITS        04f1a000 4f19000 0206b8 00  WA  0   0 32
  [30] .bss              NOBITS          04f3a6c0 4f396b8 04c800 00  WA  0   0 32
  [31] .comment          PROGBITS        00000000 4f396b8 00002a 01  MS  0   0  1
  [32] .shstrtab         STRTAB          00000000 4f396e2 00013e 00      0   0  1
  [33] .symtab           SYMTAB          00000000 4f39d98 4ff960 10     34 140163  4
  [34] .strtab           STRTAB          00000000 54396f8 144992a 00      0   0  1
Key to Flags:
  W (write), A (alloc), X (execute), M (merge), S (strings)
  I (info), L (link order), G (group), T (TLS), E (exclude), x (unknown)
  O (extra OS processing required) o (OS specific), p (processor specific)

我应该查看.init还是.init_array?您能否指出相应的文档来解释gcc或链接器版本之间的变化?

2 个答案:

答案 0 :(得分:8)

静态构造函数可以由.init.ctors.init_array三个部分中的任何部分触发(按此顺序最旧到最新)。 .init包含代码片段,.ctors.init_array包含指向代码的指针。 .ctors.init_array之间的差异与执行构造函数的整体顺序有关。据我所知,除了代码注释和邮件列表帖子之外,其他任何内容都没有记录,但是可能值得检查ELF ABI文档(g-和ps-两者)。

不能从这些部分的任何的大小中推断出文件中静态构造函数的数量。编译器允许并且通用,生成一个特殊的函数,该函数调用文件中的所有构造函数,并且在它使用的任何部分中仅引用该函数。所有你可以确定的(没有检查部分的内容,应用重定位,并将指针/调用指令追踪到.text段并对所调用的任何内容进行逆向工程)是:在目标文件中,如果这些部分中至少有一个具有非零大小,则文件中至少有一个文件或全局范围构造函数;如果所有三个部分都是空的,则没有。 (在可执行文件中,所有三个部分都是非空的,因为它们定义的数据结构需要在链接时自动添加的标题和预告片。)

另请注意,块作用域静态对象的构造函数是从以下任何部分调用的 ;他们在第一次控制到达他们的声明时被调用。

答案 1 :(得分:0)

我假设您可以访问应用程序的所有源代码(也许可以访问所有被调用的库)。这显然适用于自由软件。

然后,您可以在编译时(使用最新版本的GCC,例如4.7或4.8)编译应用程序时更精确地测量。您可以使用MELT(这是一种扩展GCC的高级域特定语言)扩展它,或者用C ++编写的痛苦的GCC插件来扩展它来测量这些东西。

我并不完全确定你的问题是否真的有道理。如果您的申请是链接到一些共享库,它使用可见性技巧隐藏其静态构造函数,了解库调用的静态构造函数实际上没有定义。