LD_PRELOAD如何在我的代码中工作

时间:2016-01-04 14:06:59

标签: c ld glibc

LD_PRELOAD可用于在另一个之前链接共享对象。所以我尝试在glibc中覆盖memcpy。

我定义了我的memcpy,它将反转src的字节顺序并返回NULL以区分glibc' memcpy

mymem.c

#include <string.h>

void *memcpy(void *dest, const void *src, size_t n) {
    char *dest_c = dest;
    const char *src_c = src;
    size_t i = 0;

    //reverse the byte order in src
    for(i = 0; i < n; i++)
        dest_c[i] = src_c[n-i-1];

    return NULL;
}

test.c的

#include <stdio.h>
#include <string.h>

int main() {
    char str[] = "hello";
    char str2[100] = {};
    char *ret;

    //print the address of str2
    printf("str2: %p\n", str2);

    //print str2, address of memcpy, return value of memcpy
    ret = memcpy(str2, str, 6);
    printf("%s %p %p\n", str2, memcpy, ret);

    //the same
    ret = memcpy(str2, str, 3);
    printf("%s %p %p\n", str2, memcpy, ret);

    //the same
    ret = memcpy(str2, str, 8);
    printf("%s %p %p\n", str2, memcpy, ret);

    return 0;
}

编译&amp;运行:

$gcc -shared -o libmem.so mymem.c
$gcc test.c -o test
$export LD_PRELOAD="./libmem.so"
$./test

结果:

str2: 0x7fff0297e710
hello 0x400470 0x7fff0297e710
lehlo 0x400470 (nil)
 0x400470 (nil)

当第三个参数等于char数组的大小时,输出不是我预期的(在这种情况下,sizeof str是6)。

在第一个memcpy之后,我认为str2 [0]应该是&#39; \ 0&#39;,所以str2是一个空字符串,但输出是&#34; hello&#34;。 memcpy的返回值应该为NULL,但输出是str2的地址。它看起来像glic的memcpy(我不确定)。

另外两个memcpy正如我预期的那样工作。

我在debian 8和ubuntu 14.04测试它。

有人可以解释一下吗?

2 个答案:

答案 0 :(得分:1)

这是因为出于某种原因,GCC决定使用memcpy的内联版本来第一次调用memcpy。为避免这种情况,您可以使用-fno-builtin选项。

另请注意,如果由于某种原因memcpy静态链接到可执行文件,则可能导致memcpy静态解析。由于memcpy是一个低级函数,因此CRT启动代码(静态链接)可以提供实现并非不可能。

答案 1 :(得分:1)

只需对二进制文件执行objdump -DS(如已建议的qarma),您就可以看到第一个memcpy未生成函数调用。这就是它在我的机器上的样子:

//print str2, address of memcpy, return value of memcpy                         
ret = memcpy(str2, str, 6);                                                     
40066e:       8b 85 70 ff ff ff       mov    -0x90(%rbp),%eax                     
400674:       89 45 80                mov    %eax,-0x80(%rbp)                     
400677:       0f b7 85 74 ff ff ff    movzwl -0x8c(%rbp),%eax                     
40067e:       66 89 45 84             mov    %ax,-0x7c(%rbp)                      
400682:       48 8d 45 80             lea    -0x80(%rbp),%rax                     
400686:       48 89 85 68 ff ff ff    mov    %rax,-0x98(%rbp) 

尝试使用-fno-builtin-memcpy进行编译 - 它应该解决这个问题:

ret = memcpy(str2, str, 6);
40066e:       48 8d 8d 70 ff ff ff    lea    -0x90(%rbp),%rcx
400675:       48 8d 45 80             lea    -0x80(%rbp),%rax
400679:       ba 06 00 00 00          mov    $0x6,%edx
40067e:       48 89 ce                mov    %rcx,%rsi
400681:       48 89 c7                mov    %rax,%rdi
400684:       e8 87 fe ff ff          callq  400510 <memcpy@plt>
400689:       48 89 85 68 ff ff ff    mov    %rax,-0x98(%rbp)