如何使用libelf为我自己的编译器生成ELF文件?

时间:2012-11-10 06:31:39

标签: c file assembly x86 elf

我为我正在编写的更简单的编译器生成了代码,我想知道如何将该代码放入ELF文件中?

我尝试过使用libelf,但我似乎无法理解如何组织表格。

我没有使用任何数据,所以我认为我需要的只是.text部分。

如果我有一个生成的x86代码的缓冲区,我如何创建一个只有一个可以运行的简单.text部分的ELF文件?

1 个答案:

答案 0 :(得分:6)

简答

你不能!

您正在寻找的功能实际上是名为“链接器”的构建工具的一部分。尽管除了一些未解决的符号错误之外,它还会不时地抛出它的存在而不被注意,它是任何构建链中最重要的组件之一。

长答案

这里有一些想法如何以某种方式让你的二进制文件运行。

限制

下面描述的任何方法仅在

时有效
  • 机器代码包含任何具有绝对地址的跳转,因为将它们修补到正确的目的地需要重新定位信息。

  • 程序从用作输入的二进制文件的最开始

    开始

    通过在二进制数据中使用偏移量向文件开头的“右”点添加附加(相对)跳转指令,可以很容易地避免这种情况。

建议的解决方法

如果一个非常简单的“自包含”包含的二进制文件仅由一堆没有任何外部依赖关系的原始机器指令给出,并且没有(!)任何绝对跳转指令而不是通过可以更容易地使用现有的链接器。

给定一个由原始机器指令组成的文件(以下示例中为 main.bin ),第一步将涉及生成共享对象( main.o 例子):

objcopy -I binary -B i386 -O elf32-i386 --rename-section .data=.text main.bin main.o

查看生成的对象符号表readelf -S

Symbol table '.symtab' contains 5 entries:
   Num:    Value  Size Type    Bind   Vis      Ndx Name
     0: 00000000     0 NOTYPE  LOCAL  DEFAULT  UND 
     1: 00000000     0 SECTION LOCAL  DEFAULT    1 
     2: 00000000     0 NOTYPE  GLOBAL DEFAULT    1 _binary_main_bin_start
     3: 0000000c     0 NOTYPE  GLOBAL DEFAULT    1 _binary_main_bin_end
     4: 0000000c     0 NOTYPE  GLOBAL DEFAULT  ABS _binary_main_bin_size

您会注意到,根据输入文件的开头,结尾和大小添加了符号_binary_..._start_binary_..._end_binary_..._size。 这些可用于将可执行文件的入口点传递给链接器。

ld --entry=_binary_main_bin_start main.o -o main

应生成您正在寻找的可执行文件。

手动生成

或者,您可能希望手动创建一个仅包含必要信息的elf文件,以获取正在运行的可执行文件。

如果您对elf格式不太熟悉,可能需要查看规范(可在http://refspecs.linuxfoundation.org/上找到)。手册页(man elf)也非常详尽,因此这也可能是很好的信息来源。

为了保持最简单,目标只是使用绝对必要的东西。

查看规格,您会看到在任何情况下唯一需要的组件是精灵标题。 只有共享对象才需要节头表,只有可执行文件的程序头表才需要。

由于我们要创建一个可执行文件,我们只使用程序头表,其中一个类型为PT_LOAD的条目描述了可执行文件的整个内存布局。

为了满足对齐约束,过程映像将包含二进制文件的全部内容。(来源:man elf)。

  

......可加载的流程段必须具有p_vaddr和p_offset的全等值,以页面大小为模。

据说应该清楚为什么elf文件的最终布局如下所示:

struct Binary {
  Elf32_Ehdr ehdr;
  Elf32_Phdr phdr;
  char code[];
};

Elf32_Ehdr和Elf32_Phdr的大多数字段都是固定的,因此它们已经可以在初始化程序中设置。需要稍后调整的唯一字段是描述程序头表项中已加载段的大小(.p_filesz和.p_memsz)的字段。

从stdin获取输入并写入stdout(因此像./a.out <main.bin >executable一样使用)这是所描述的设置的实现方式:

#include <stdio.h>
#include <stddef.h>
#include <elf.h>
#include <string.h>
#include <stdlib.h>

#define BUFFER_SIZE 1024
char buffer[BUFFER_SIZE];

void *read_all (int *filesize) {
  void *data = NULL;
  int offset = 0;
  int size = 0;

  while ((size = fread (buffer, 1, sizeof (buffer), stdin)) > 0) {
    if ((data = realloc (data, offset + size)) == NULL)
      exit (-1);
    memcpy (data + offset, buffer, size);
    offset += size;
  }
  *filesize = offset;
  return data;
}


#define LOAD_ADDRESS 0x8048000

struct Binary {
  Elf32_Ehdr ehdr;
  Elf32_Phdr phdr;
  char code[];
};

int main (int argc, char *argv[]) {

  void *code;
  int code_size;

  struct Binary binary = {
    /* ELF HEADER */
    .ehdr = {
      /* general */
      .e_ident   = {
        ELFMAG0, ELFMAG1, ELFMAG2, ELFMAG3,
        ELFCLASS32, 
        ELFDATA2LSB,
        EV_CURRENT,
        ELFOSABI_LINUX,
      },
      .e_type    = ET_EXEC,
      .e_machine = EM_386,
      .e_version = EV_CURRENT,
      .e_entry   = LOAD_ADDRESS + (offsetof (struct Binary, code)),
      .e_phoff   = offsetof (struct Binary, phdr),
      .e_shoff   = 0,
      .e_flags   = 0,
      .e_ehsize   = sizeof (Elf32_Ehdr),
      /* program header */
      .e_phentsize = sizeof (Elf32_Phdr),
      .e_phnum     = 1,
      /* section header */
      .e_shentsize = sizeof (Elf32_Shdr),
      .e_shnum     = 0,
      .e_shstrndx  = 0
    },

    /* PROGRAM HEADER */
    .phdr = {
      .p_type   = PT_LOAD,
      .p_offset = 0,
      .p_vaddr = LOAD_ADDRESS,
      .p_paddr = LOAD_ADDRESS,
      .p_filesz = 0,
      .p_memsz = 0,
      .p_flags = PF_R | PF_X,
      .p_align = 0x1000
    }
  };

  if ((code = read_all (&code_size)) == NULL)
    return -1;

  /* fix program header */
  binary.phdr.p_filesz = sizeof (struct Binary) + code_size;
  binary.phdr.p_memsz = sizeof (struct Binary) + code_size;

  /* write binary */
  fwrite (&binary, sizeof (struct Binary), 1, stdout);
  fwrite (code, 1, code_size, stdout);

  free (code);

  return 0;
}