我试图使用C语言读取二进制文件中使用的共享库的名称。到目前为止,我在test.c
中有以下程序:
#include <string.h>
#include <sys/mman.h>
#include <elf.h>
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <unistd.h>
#include <fcntl.h>
int main(int argc, char **argv) {
const char *ls = NULL;
int fd = -1;
struct stat stat = {0};
if (argc != 2) {
printf("Missing arg\n");
return 0;
}
// open the file in readonly mode
fd = open(argv[1], O_RDONLY);
if (fd < 0) {
perror("open");
goto cleanup;
}
// get the file size
if (fstat(fd, &stat) != 0) {
perror("stat");
goto cleanup;
}
// put the file in memory
ls = mmap(NULL, stat.st_size, PROT_READ, MAP_PRIVATE, fd, 0);
if (ls == MAP_FAILED) {
perror("mmap");
goto cleanup;
}
Elf64_Ehdr *eh = (Elf64_Ehdr *)ls;
// looking for the PT_DYNAMIC segment
for (int i = 0; i < eh->e_phnum; i++) {
Elf64_Phdr *ph = (Elf64_Phdr *)((char *)ls + (eh->e_phoff + eh->e_phentsize * i));
const char *strtab = NULL;
if (ph->p_type == PT_DYNAMIC) {
const Elf64_Dyn *dtag_table = (const Elf64_Dyn *)(ls + ph->p_offset);
// looking for the string table
for (int j = 0; 1; j++) {
// the end of the dtag table is marked by DT_NULL
if (dtag_table[j].d_tag == DT_NULL) {
break;
}
if (dtag_table[j].d_tag == DT_STRTAB) {
strtab = (const char *)dtag_table[j].d_un.d_ptr;
printf("string table addr: %p\n", strtab);
}
}
// no string table ? we're stuck, bail out
if (strtab == NULL) {
printf("no strtab, abort\n");
break;
}
// now, i print shared libraries
for (int j = 0; 1; j++) {
// the end of the dtag table is marked by DT_NULL
if (dtag_table[j].d_tag == DT_NULL) {
break;
}
if (dtag_table[j].d_tag == DT_NEEDED) {
printf("too long: %d\n", &strtab[dtag_table[j].d_un.d_val] >= ls + stat.st_size);
printf("string offset in strtab: %lu\n", dtag_table[j].d_un.d_val);
printf("string from strtab: %s\n", &strtab[dtag_table[j].d_un.d_val]);
}
}
// only go through the PT_DYNAMIC segment we found,
// other segments dont matter
break;
}
}
// cleanup memory
cleanup:
if (fd != -1) {
close(fd);
}
if (ls != MAP_FAILED) {
munmap((void *)ls, stat.st_size);
}
return 0;
}
我用以下代码编译它:
gcc -g -Wall -Wextra test.c
当我运行./a.out a.out
(所以阅读它自己的共享库)时,似乎工作正常,我得到以下输出:
string table addr: 0x4003d8
too long: 0
string offset in strtab: 1
string from strtab: libc.so.6
但是,当我针对系统二进制文件(例如/bin/ls
,./a.out /bin/ls
)运行它时,我会在第78行遇到段错误。
string table addr: 0x401030
too long: 0
string offset in strtab: 1
Segmentation fault (core dumped)
我不知道为什么。使用/bin/ls
阅读readelf
,我使用的地址似乎正确,字符串偏移似乎也是正确的:
$ readelf -a /bin/ls | grep dynstr
...
[ 6] .dynstr STRTAB 0000000000401030 00001030
...
$ readelf -p .dynstr /bin/ls
String dump of section '.dynstr':
[ 1] libselinux.so.1
...
我做错了什么?
答案 0 :(得分:1)
我做错了什么?
对于非PIE二进制文件,这个:
strtab = (const char *)dtag_table[j].d_un.d_ptr;
如果该二进制文件实际在当前进程中运行,则指向.dynstr
所在的位置。
如果二进制文件不正在运行,则需要将此值重新定位$where_mmaped - $load_addr
。 $where_mmaped
是您的ls
变量。 $load_addr
是二进制文件静态链接到加载的地址(通常是第一个p_vaddr
段的PT_LOAD
;对于x86_64二进制文件,典型值为0x400000
)。
您会注意到,这清楚地解释了为什么./a.out a.out
有效:您从自己的地址空间阅读.dynstr
,同时使用a.out
找出正确的偏移量。