如何使linux共享对象(库)自行运行?

时间:2015-07-17 21:11:03

标签: c linux

注意到gcc -shared创建了一个可执行文件,我只是有一个奇怪的想法来检查当我尝试运行它时会发生什么......结果是我自己的 segfault 库。因此,对此感到好奇,我试图“运行”glibc(/lib/x86_64-linux-gnu/libc.so.6在我的系统上)。果然,它没有崩溃,但为我提供了一些输出:

GNU C Library (Debian GLIBC 2.19-18) stable release version 2.19, by Roland McGrath et al.
Copyright (C) 2014 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.
There is NO warranty; not even for MERCHANTABILITY or FITNESS FOR A
PARTICULAR PURPOSE.
Compiled by GNU CC version 4.8.4.
Compiled on a Linux 3.16.7 system on 2015-04-14.
Available extensions:
    crypt add-on version 2.1 by Michael Glad and others
    GNU Libidn by Simon Josefsson
    Native POSIX Threads Library by Ulrich Drepper et al
    BIND-8.2.3-T5B
libc ABIs: UNIQUE IFUNC
For bug reporting instructions, please see:
<http://www.debian.org/Bugs/>.

所以我的问题是:这背后的魔力是什么?我不能在库中定义main符号 - 或者我可以吗?

1 个答案:

答案 0 :(得分:14)

我在这个主题上写了a blog post,我更深入地了解它,因为我觉得它很有趣。您可以在下面找到我的原始答案。

您可以使用gcc的-Wl,-e,entry_point选项为链接器指定自定义入口点,其中entry_point是库的名称&#34; main&#34;功能

void entry_point()
{
    printf("Hello, world!\n");
}

链接器并不期望与-shared链接的内容作为可执行文件运行,并且必须为程序提供更多信息才能运行。如果您现在尝试运行库,则会遇到分段错误。

.interp部分是操作系统运行应用程序所需的结果二进制文件的一部分。如果未使用-shared,则链接器会自动设置它。如果要构建要自行执行的共享库,则必须在C代码中手动设置此部分。请参阅this question

解释器的工作是找到并加载程序所需的共享库,准备程序运行,然后运行它。对于Linux上的ELF格式(普遍适用于现代* nix),使用ld-linux.so程序。有关详细信息,请参阅man page

下面的行使用GCC attributes将字符串放在.interp部分中。将它放在库的全局范围内,以明确告诉链接器您希望在二进制文件中包含动态链接器路径。

const char interp_section[] __attribute__((section(".interp"))) = "/path/to/ld-linux";

找到ld-linux.so路径的最简单方法是在任何正常应用程序上运行ldd。我系统的示例输出:

jacwah@jacob-mint17 ~ $ ldd $(which gcc)
    linux-vdso.so.1 =>  (0x00007fff259fe000)
    libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007faec5939000)
    /lib64/ld-linux-x86-64.so.2 (0x00007faec5d23000)

一旦您指定了解释器,您的库就应该是可执行的!只有一个轻微的缺陷:entry_point返回时会出现段错误。

使用main编译程序时,它不是执行时调用的第一个函数。 main实际上是由另一个名为_start的函数调用的。此功能负责设置argvargc以及其他初始化。然后它会调用main。当main返回时,_start调用exit,返回值为main

_start中的堆栈上没有返回地址,因为它是第一个要调用的函数。如果它尝试返回,则会发生无效读取(最终导致分段错误)。这正是我们的入口点函数中发生的事情。添加对exit的调用作为输入函数的最后一行,以正确清理而不是崩溃。

<强> example.c

#include <stdio.h>
#include <stdlib.h>

const char interp_section[] __attribute__((section(".interp"))) = "/path/to/ld-linux";

void entry_point()
{
    printf("Hello, world!\n");
    exit(0);
}

gcc example.c -shared -fPIC -Wl,-e,entry_point汇编。