在ELF文件中读取.dynstr(strtab)时的Segfault

时间:2017-05-24 06:49:11

标签: c linux elf

我试图使用C语言读取二进制文件中使用的共享库的名称。到目前为止,我在test.c中有以下程序:

#include <string.h>
#include <sys/mman.h>
#include <elf.h>
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <unistd.h>
#include <fcntl.h>

int main(int argc, char **argv) {
    const char *ls = NULL;
    int fd = -1;
    struct stat stat = {0};

    if (argc != 2) {
      printf("Missing arg\n");
      return 0;
    }

    // open the file in readonly mode
    fd = open(argv[1], O_RDONLY);
    if (fd < 0) {
        perror("open");
        goto cleanup;
    }

    // get the file size
    if (fstat(fd, &stat) != 0) {
        perror("stat");
        goto cleanup;
    }

    // put the file in memory
    ls = mmap(NULL, stat.st_size, PROT_READ, MAP_PRIVATE, fd, 0);
    if (ls == MAP_FAILED) {
        perror("mmap");
        goto cleanup;
    }

    Elf64_Ehdr *eh = (Elf64_Ehdr *)ls;
    // looking for the PT_DYNAMIC segment
    for (int i = 0; i < eh->e_phnum; i++) {
        Elf64_Phdr *ph = (Elf64_Phdr *)((char *)ls + (eh->e_phoff + eh->e_phentsize * i));
        const char *strtab = NULL;
        if (ph->p_type == PT_DYNAMIC) {
            const Elf64_Dyn *dtag_table = (const Elf64_Dyn *)(ls + ph->p_offset);

            // looking for the string table
            for (int j = 0; 1; j++) {
                // the end of the dtag table is marked by DT_NULL
                if (dtag_table[j].d_tag == DT_NULL) {
                    break;
                }

                if (dtag_table[j].d_tag == DT_STRTAB) {
                  strtab = (const char *)dtag_table[j].d_un.d_ptr;
                  printf("string table addr: %p\n", strtab);
                }
            }

            // no string table ? we're stuck, bail out
            if (strtab == NULL) {
              printf("no strtab, abort\n");
              break;
            }

            // now, i print shared libraries
            for (int j = 0; 1; j++) {
                // the end of the dtag table is marked by DT_NULL
                if (dtag_table[j].d_tag == DT_NULL) {
                    break;
                }

                if (dtag_table[j].d_tag == DT_NEEDED) {
                  printf("too long: %d\n", &strtab[dtag_table[j].d_un.d_val] >= ls + stat.st_size);
                  printf("string offset in strtab: %lu\n", dtag_table[j].d_un.d_val);
                  printf("string from strtab: %s\n", &strtab[dtag_table[j].d_un.d_val]);
                }
            }

            // only go through the PT_DYNAMIC segment we found,
            // other segments dont matter
            break;
        }
    }

    // cleanup memory
    cleanup:
    if (fd != -1) {
        close(fd);
    }
    if (ls != MAP_FAILED) {
        munmap((void *)ls, stat.st_size);
    }

    return 0;
}

我用以下代码编译它:

gcc -g -Wall -Wextra test.c

当我运行./a.out a.out(所以阅读它自己的共享库)时,似乎工作正常,我得到以下输出:

string table addr: 0x4003d8
too long: 0
string offset in strtab: 1
string from strtab: libc.so.6

但是,当我针对系统二进制文件(例如/bin/ls./a.out /bin/ls)运行它时,我会在第78行遇到段错误。

string table addr: 0x401030
too long: 0
string offset in strtab: 1
Segmentation fault (core dumped)

我不知道为什么。使用/bin/ls阅读readelf,我使用的地址似乎正确,字符串偏移似乎也是正确的:

$ readelf -a /bin/ls | grep dynstr
...
[ 6] .dynstr           STRTAB           0000000000401030  00001030
...

$ readelf -p .dynstr /bin/ls
String dump of section '.dynstr':
  [     1]  libselinux.so.1
  ...

我做错了什么?

1 个答案:

答案 0 :(得分:1)

  

我做错了什么?

对于非PIE二进制文件,这个:

strtab = (const char *)dtag_table[j].d_un.d_ptr;
如果该二进制文件实际在当前进程中运行,则

指向.dynstr 所在的位置

如果二进制文件正在运行,则需要将此值重新定位$where_mmaped - $load_addr$where_mmaped是您的ls变量。 $load_addr是二进制文件静态链接到加载的地址(通常是第一个p_vaddr段的PT_LOAD;对于x86_64二进制文件,典型值为0x400000)。

您会注意到,这清楚地解释了为什么./a.out a.out有效:您从自己的地址空间阅读.dynstr,同时使用a.out找出正确的偏移量。