为什么.rodata节中的静态字符串在GCC中有一个四点前缀?

时间:2016-01-11 23:38:21

标签: c gcc assembly

以下代码:

#include <stdio.h>

int main() {
    printf("Hello World");
    printf("Hello World1");
    return 0;
}

生成的用于调用printf的程序集如下(64位):

  400474:   be 24 06 40 00          mov    esi,0x400624
  400479:   bf 01 00 00 00          mov    edi,0x1
  40047e:   31 c0                   xor    eax,eax
  400480:   e8 db ff ff ff          call   400460 <__printf_chk@plt>
  400485:   be 30 06 40 00          mov    esi,0x400630
  40048a:   bf 01 00 00 00          mov    edi,0x1
  40048f:   31 c0                   xor    eax,eax
  400491:   e8 ca ff ff ff          call   400460 <__printf_chk@plt>

.rodata部分如下:

Contents of section .rodata:
 400620 01000200 48656c6c 6f20576f 726c6400  ....Hello World.
 400630 48656c6c 6f20576f 726c6431 00        Hello World1.

基于汇编代码,对printf的第一次调用具有地址400624的参数,该参数与.rodata的开头有4个字节的偏移量。我知道它会跳过这4个点前缀的前4个字节。但我的问题是为什么GCC /链接器在.rodata中为字符串生成这个前缀?我在Ubuntu 14.04上使用4.8.4 GCC。编译cmd只是:gcc -Ofast my-source.c -o my-program

2 个答案:

答案 0 :(得分:9)

首先,那些不是四个点,点只是意味着不可打印的字符。您可以在十六进制转储中看到这些字节是01 00 02 00

最终程序包含链接器添加的其他目标文件,它们是C运行时库的一部分。这些数据由那里的代码使用。

您可以看到地址为0x400620。然后,您可以尝试查找匹配的符号,例如,您可以将其加载到gdb并使用info symbol命令:

(gdb) info symbol 0x4005f8
_IO_stdin_used in section .rodata of /tmp/a.out

(注意我的地址不同。)

进一步说,你实际上可以找到source for this in glibc

/* This records which stdio is linked against in the application. */
const int _IO_stdin_used = _G_IO_IO_FILE_VERSION;

and

#define _G_IO_IO_FILE_VERSION 0x20001

对应于您考虑使用小端存储时所看到的值。

答案 1 :(得分:2)

为数据添加前缀。 .rodata可以包含任何内容。前四个字节[看似]是一个字符串,但它恰好链接在那里(即它是其他东西)。它与你的&#34; Hello World&#34;

无关