ELF文件格式中节和段的区别是什么

时间:2013-01-16 14:58:24

标签: linux debian gnu elf abi

来自wiki Executable and Linkable Format

  

段包含运行时执行文件所必需的信息,而段包含用于链接和重定位的重要数据。整个文件中的任何字节最多只能由一个部分拥有,并且可能存在不属于任何部分的孤立字节。

但是段和段之间有什么区别? 在可执行的ELF文件中,段是否包含一个或多个部分?

3 个答案:

答案 0 :(得分:53)

  

但是段和段之间有什么区别?

您所引用的内容:这些段包含运行时所需的信息,而这些部分包含链接期间所需的信息。

  

段是否包含一个或多个部分?

一个细分可以包含0个或更多个部分。例如:

readelf -l /bin/date

Elf file type is EXEC (Executable file)
Entry point 0x402000
There are 9 program headers, starting at offset 64

Program Headers:
  Type           Offset             VirtAddr           PhysAddr
                 FileSiz            MemSiz              Flags  Align
  PHDR           0x0000000000000040 0x0000000000400040 0x0000000000400040
                 0x00000000000001f8 0x00000000000001f8  R E    8
  INTERP         0x0000000000000238 0x0000000000400238 0x0000000000400238
                 0x000000000000001c 0x000000000000001c  R      1
      [Requesting program interpreter: /lib64/ld-linux-x86-64.so.2]
  LOAD           0x0000000000000000 0x0000000000400000 0x0000000000400000
                 0x000000000000d5ac 0x000000000000d5ac  R E    200000
  LOAD           0x000000000000de10 0x000000000060de10 0x000000000060de10
                 0x0000000000000440 0x0000000000000610  RW     200000
  DYNAMIC        0x000000000000de38 0x000000000060de38 0x000000000060de38
                 0x00000000000001a0 0x00000000000001a0  RW     8
  NOTE           0x0000000000000254 0x0000000000400254 0x0000000000400254
                 0x0000000000000044 0x0000000000000044  R      4
  GNU_EH_FRAME   0x000000000000c700 0x000000000040c700 0x000000000040c700
                 0x00000000000002a4 0x00000000000002a4  R      4
  GNU_STACK      0x0000000000000000 0x0000000000000000 0x0000000000000000
                 0x0000000000000000 0x0000000000000000  RW     8
  GNU_RELRO      0x000000000000de10 0x000000000060de10 0x000000000060de10
                 0x00000000000001f0 0x00000000000001f0  R      1

 Section to Segment mapping:
  Segment Sections...
   00     
   01     .interp 
   02     .interp .note.ABI-tag .note.gnu.build-id .gnu.hash .dynsym .dynstr .gnu.version .gnu.version_r .rela.dyn .rela.plt .init .plt .text .fini .rodata .eh_frame_hdr .eh_frame 
   03     .ctors .dtors .jcr .dynamic .got .got.plt .data .bss 
   04     .dynamic 
   05     .note.ABI-tag .note.gnu.build-id 
   06     .eh_frame_hdr 
   07     
   08     .ctors .dtors .jcr .dynamic .got 

此处,PHDR段包含0个部分,INTERP段包含.interp部分,第一个LOAD部分包含大量部分。

Further reading有一个不错的illustration

答案 1 :(得分:24)

部分包含链接器的静态,为操作系统分段动态数据

引用是正确的,但要真正理解它的区别,您应该尝试理解节头和程序头(段)条目的字段,以及链接器(节)和操作系统如何使用它们(段)。

特别重要的信息是(除了长度):

  • 部分:告诉链接器部分是否为:

    • 要加载到存储器中的原始数据,例如.data.text
    • 或关于其他部分的格式化元数据,将由链接器使用,但在运行时消失,例如.symtab.srttab.rela.text
  • 段:告诉操作系统:

    • 应将段加载到虚拟内存中
    • 段具有哪些权限(读取,写入,执行)。请记住,处理器可以有效地执行此操作:How does x86 paging work?

我已经编写了一个教程,详细介绍了http://www.cirosantilli.com/elf-hello-world/

细分受众群是否包含一个或多个部分?

是的,链接器将节放入段中。

在Binutils中,ld如何将段放入段中由一个名为链接描述文件的文本文件确定。文档:https://sourceware.org/binutils/docs/ld/Scripts.html

您可以使用ld --verbose获取默认值,并使用-T设置自定义值。

例如,我的默认Ubuntu 17.04链接描述文件包含:

  .text           :                                                                                                                                                             
  {                                                                                                                                                                             
    *(.text.unlikely .text.*_unlikely .text.unlikely.*)                                                                                                                         
    *(.text.exit .text.exit.*)                                                                                                                                                  
    *(.text.startup .text.startup.*)                                                                                                                                            
    *(.text.hot .text.hot.*)                                                                                                                                                    
    *(.text .stub .text.* .gnu.linkonce.t.*)                                                                                                                                                                                                                                                                                               
  } 

告诉链接器在.text.unlikely段中放置名为.text.*_unlikely.text.exit.text等的部分。

操作系统开发是自定义脚本很有用的一种情况,最小例子:https://github.com/cirosantilli/x86-bare-metal-examples/blob/d217b180be4220a0b4a453f31275d38e697a99e0/linker.ld

连接可执行文件后,只有链接器在可执行文件中存储可选节标题时,才能知道哪个节转到哪个节:Where is the "Section to segment mapping" stored in ELF files?

答案 2 :(得分:0)

如果我错了,请纠正我,因为我不会认为自己是该主题的专家,但是根据我的研究,答案/评论中给出的某些陈述似乎并不完全正确。详细地说,我将引用句子并对其进行评论:

该部分包含用于链接程序的静态文件,为OS分段动态数据

根据this LWN文章,内核仅使用PT_INTERP,PT_LOAD和PT_GNU_STACK类型的段头将可执行文件加载到内存中。但是还有其他段类型,例如PHDR,DYNAMIC,NOTE,GNU_EH_FRAME,GNU_PROPERTY,GNU_RELRO,将被忽略。

Afaiu,GNU_RELRO段就像一个虚拟段;如果存在,则加载程序将其用作标志,以使重定位数据变为只读。但是,加载器不是操作系统的一部分,至少对于Linux而言。

对于其他细分类型,我还没有发现它们的实际用途。对于我来说,它们似乎是多余的,因为相应的部分基本上具有相同或更多的信息。

因此,据我了解,答案只是对更混乱的事实的简化近似。

部分包含在细分中

您可以使用带有no section header的ELF可执行文件,并且可重定位(* .o)文件通常没有段头。此外,在已接受答案的readelf输出中,可以在多个段中看到.interp部分。我没有看到任何收容限制。

这些段包含运行时所需的信息,而这些段包含链接期间所需的信息。

再次,这似乎是一种简化。运行时加载程序(或“解释程序”)还需要用于加载共享库,解析符号,进行重定位等部分。

总而言之,尽管给出的答案可能是合理的一般近似值,但在查看细节时,显然变得更加复杂。