以下代码:
#include <stdio.h>
int main() {
printf("Hello World");
printf("Hello World1");
return 0;
}
生成的用于调用printf的程序集如下(64位):
400474: be 24 06 40 00 mov esi,0x400624
400479: bf 01 00 00 00 mov edi,0x1
40047e: 31 c0 xor eax,eax
400480: e8 db ff ff ff call 400460 <__printf_chk@plt>
400485: be 30 06 40 00 mov esi,0x400630
40048a: bf 01 00 00 00 mov edi,0x1
40048f: 31 c0 xor eax,eax
400491: e8 ca ff ff ff call 400460 <__printf_chk@plt>
.rodata部分如下:
Contents of section .rodata:
400620 01000200 48656c6c 6f20576f 726c6400 ....Hello World.
400630 48656c6c 6f20576f 726c6431 00 Hello World1.
基于汇编代码,对printf的第一次调用具有地址400624的参数,该参数与.rodata的开头有4个字节的偏移量。我知道它会跳过这4个点前缀的前4个字节。但我的问题是为什么GCC /链接器在.rodata中为字符串生成这个前缀?我在Ubuntu 14.04上使用4.8.4 GCC。编译cmd只是:gcc -Ofast my-source.c -o my-program
。
答案 0 :(得分:9)
首先,那些不是四个点,点只是意味着不可打印的字符。您可以在十六进制转储中看到这些字节是01 00 02 00
。
最终程序包含链接器添加的其他目标文件,它们是C运行时库的一部分。这些数据由那里的代码使用。
您可以看到地址为0x400620
。然后,您可以尝试查找匹配的符号,例如,您可以将其加载到gdb
并使用info symbol
命令:
(gdb) info symbol 0x4005f8
_IO_stdin_used in section .rodata of /tmp/a.out
(注意我的地址不同。)
进一步说,你实际上可以找到source for this in glibc:
/* This records which stdio is linked against in the application. */
const int _IO_stdin_used = _G_IO_IO_FILE_VERSION;
#define _G_IO_IO_FILE_VERSION 0x20001
对应于您考虑使用小端存储时所看到的值。
答案 1 :(得分:2)
不为数据添加前缀。 .rodata
可以包含任何内容。前四个字节[看似]是一个字符串,但它恰好链接在那里(即它是其他东西)。它与你的&#34; Hello World&#34;