为什么组装的可执行文件大小相同

时间:2016-09-09 04:28:14

标签: assembly x86-64 intel instructions

在x86_64架构中,可以将一些指令操作数组合更改为较短的组合以实现相同的效果,但可执行文件较小。 例如,通常写:

xor eax, eax

而不是:

xor rax, rax

我想测试它,在汇编中编写简单的程序:

    segment .text
    global main
main:
    push rbp
    mov rbp, rsp
    xor rax, rax ; line in question
    leave
    ret

建:

yasm -f elf64 -m amd64 -g dwarf2 main.asm; clang -o main main.o

选中尺寸:

stat main

得到:

....
Size: 9184
...

好的,将问题更改为:

xor eax, eax

希望获得更小的可执行文件,但获得相同的9184字节大小。 使用较短的指令形式为什么尺寸没有减少?

3 个答案:

答案 0 :(得分:6)

当目标文件链接在一起时,链接器会在main.o的.text部分的末尾插入填充,因此crt0.o的文本部分的开头始于16B对齐边界。

如果你像我建议的那样反汇编你的二进制文件,你就会看到这个:

$ objdump -Mintel -drw main
...
0000000000400500 <main>:
  400500:       55                      push   rbp
  400501:       48 89 e5                mov    rbp,rsp
  400504:       48 31 c0                xor    rax,rax
  400507:       c9                      leave  
  400508:       c3                      ret    
  400509:       0f 1f 80 00 00 00 00    nop    DWORD PTR [rax+0x0]    <--- padding inserted by linker

0000000000400510 <__libc_csu_init>:
  400510:       41 57                   push   r15
  ...

更改main()的大小只会改变NOP填充的大小,直到你传递16B边界。

有趣的是,如果你反汇编main.oret之后就没有填充,所以我认为NOP必须已被链接器插入。

使用readelf -aW main.o显示:

Section Headers:
  [Nr] Name       Type            Address          Off    Size   ES Flg Lk Inf Al
...
  [ 4] .text      PROGBITS        0000000000000000 000040 000009 00  AX  0   0 16
....

如果没有-W,您可以看到完整的列名,而不是将它们打包在一行上。最后一列是&#34; alignment&#34;。这就是yasm如何告诉链接器该对象的.text部分需要32B或链接器输出的文本段内的任何其他对齐。

ALIGN 4096之前添加main:会导致.o在.text的对齐列中具有4096。它将NOP填充添加到链接二进制文件中 main之前的函数的末尾,因此main位于0x00402000。这确实会改变二进制文件的大小。

答案 1 :(得分:5)

使用size命令查找二进制文件的大小。使用lsstat是不准确的,因为二进制文件的部分填充到2的幂(例如,到16的下一个倍数)。

但是,在您的情况下仍然没有区别,因为来自main.o的文本段被填充到16个字节的倍数,之后启动代码crt0.o被链接。因此代码大小没有区别。

答案 2 :(得分:3)

拆卸:

31 c0          xor    eax,eax  ; 2 bytes opcode
48 31 c0       xor    rax,rax  ; 3 bytes opcode

可执行文件包含许多其他内容(如其他人的评论中所述),并且您的代码也可能总体保持不变,因为下一代码可能会被其他nop对齐。不要指望文件大小会对剃掉的操作码的每个字节做出反应。