LD_PRELOAD可用于在另一个之前链接共享对象。所以我尝试在glibc中覆盖memcpy。
我定义了我的memcpy,它将反转src的字节顺序并返回NULL以区分glibc' memcpy
mymem.c
#include <string.h>
void *memcpy(void *dest, const void *src, size_t n) {
char *dest_c = dest;
const char *src_c = src;
size_t i = 0;
//reverse the byte order in src
for(i = 0; i < n; i++)
dest_c[i] = src_c[n-i-1];
return NULL;
}
test.c的
#include <stdio.h>
#include <string.h>
int main() {
char str[] = "hello";
char str2[100] = {};
char *ret;
//print the address of str2
printf("str2: %p\n", str2);
//print str2, address of memcpy, return value of memcpy
ret = memcpy(str2, str, 6);
printf("%s %p %p\n", str2, memcpy, ret);
//the same
ret = memcpy(str2, str, 3);
printf("%s %p %p\n", str2, memcpy, ret);
//the same
ret = memcpy(str2, str, 8);
printf("%s %p %p\n", str2, memcpy, ret);
return 0;
}
编译&amp;运行:
$gcc -shared -o libmem.so mymem.c
$gcc test.c -o test
$export LD_PRELOAD="./libmem.so"
$./test
结果:
str2: 0x7fff0297e710
hello 0x400470 0x7fff0297e710
lehlo 0x400470 (nil)
0x400470 (nil)
当第三个参数等于char数组的大小时,输出不是我预期的(在这种情况下,sizeof str是6)。
在第一个memcpy之后,我认为str2 [0]应该是&#39; \ 0&#39;,所以str2是一个空字符串,但输出是&#34; hello&#34;。 memcpy的返回值应该为NULL,但输出是str2的地址。它看起来像glic的memcpy(我不确定)。
另外两个memcpy正如我预期的那样工作。
我在debian 8和ubuntu 14.04测试它。
有人可以解释一下吗?
答案 0 :(得分:1)
这是因为出于某种原因,GCC决定使用memcpy
的内联版本来第一次调用memcpy
。为避免这种情况,您可以使用-fno-builtin
选项。
另请注意,如果由于某种原因memcpy
静态链接到可执行文件,则可能导致memcpy
静态解析。由于memcpy
是一个低级函数,因此CRT启动代码(静态链接)可以提供实现并非不可能。
答案 1 :(得分:1)
只需对二进制文件执行objdump -DS
(如已建议的qarma),您就可以看到第一个memcpy
未生成函数调用。这就是它在我的机器上的样子:
//print str2, address of memcpy, return value of memcpy
ret = memcpy(str2, str, 6);
40066e: 8b 85 70 ff ff ff mov -0x90(%rbp),%eax
400674: 89 45 80 mov %eax,-0x80(%rbp)
400677: 0f b7 85 74 ff ff ff movzwl -0x8c(%rbp),%eax
40067e: 66 89 45 84 mov %ax,-0x7c(%rbp)
400682: 48 8d 45 80 lea -0x80(%rbp),%rax
400686: 48 89 85 68 ff ff ff mov %rax,-0x98(%rbp)
尝试使用-fno-builtin-memcpy
进行编译 - 它应该解决这个问题:
ret = memcpy(str2, str, 6);
40066e: 48 8d 8d 70 ff ff ff lea -0x90(%rbp),%rcx
400675: 48 8d 45 80 lea -0x80(%rbp),%rax
400679: ba 06 00 00 00 mov $0x6,%edx
40067e: 48 89 ce mov %rcx,%rsi
400681: 48 89 c7 mov %rax,%rdi
400684: e8 87 fe ff ff callq 400510 <memcpy@plt>
400689: 48 89 85 68 ff ff ff mov %rax,-0x98(%rbp)