我们如何在x86 Linux中直接使用sysenter / syscall实现系统调用?有人可以提供帮助吗?如果你还可以显示amd64平台的代码,那就更好了。
我知道在x86中,我们可以使用
__asm__(
" movl $1, %eax \n"
" movl $0, %ebx \n"
" call *%gs:0x10 \n"
);
间接路由到sysenter。
但是我们如何使用sysenter / syscall直接编码来发出系统调用?
我找到了一些材料http://damocles.blogbus.com/tag/sysenter/。但仍然难以弄明白。
答案 0 :(得分:32)
我将通过编写一个使用Hello World!
系统调用将write()
写入标准输出的程序来向您展示如何执行系统调用。这是没有实际系统调用实现的程序源:
#include <sys/types.h>
ssize_t my_write(int fd, const void *buf, size_t size);
int main(void)
{
const char hello[] = "Hello world!\n";
my_write(1, hello, sizeof(hello));
return 0;
}
您可以看到我将自定义系统调用函数命名为my_write
,以避免与libc提供的“普通”write
名称冲突。本答案的其余部分包含i386和amd64的my_write
来源。
i386 Linux中的系统调用是使用第128个中断向量实现的,例如:通过在汇编代码中调用int 0x80
,当然事先已相应地设置了参数。可以通过SYSENTER
执行相同的操作,但实际执行此指令是通过VDSO虚拟映射到每个正在运行的进程来实现的。由于SYSENTER
从未被视为int 0x80
API的直接替代,因此它永远不会由用户态应用程序直接执行 - 相反,当应用程序需要访问某些内核代码时,它会调用虚拟映射的例程。 VDSO(代码中的call *%gs:0x10
代码),包含支持SYSENTER
指令的所有代码。由于指令的实际运作方式,它有很多。
如果您想了解更多相关信息,请查看this link。它包含了对内核和VDSO中应用的技术的相当简要的概述。
#define __NR_write 4
ssize_t my_write(int fd, const void *buf, size_t size)
{
ssize_t ret;
asm volatile
(
"int $0x80"
: "=a" (ret)
: "0"(__NR_write), "b"(fd), "c"(buf), "d"(size)
: "cc", "edi", "esi", "memory"
);
return ret;
}
如您所见,使用int 0x80
API相对简单。系统调用的数量转到eax
寄存器,而系统调用所需的所有参数分别分别为ebx
,ecx
,edx
,esi
, edi
和ebp
。可以通过读取文件/usr/include/asm/unistd_32.h
来获取系统调用号。手册的第2部分提供了函数的原型和描述,因此在本例中为write(2)
。由于允许内核几乎销毁任何寄存器,因此我将所有剩余的GPR放在clobber列表以及cc
上,因为eflags
寄存器也可能会发生变化。请记住,clobber列表还包含memory
参数,这意味着指令列表中列出的指令引用内存(通过buf
参数)。
AMD64架构上的情况看起来非常不同,它采用了一种名为SYSCALL
的新指令。它与原始SYSENTER
指令非常不同,并且从用户空间应用程序中使用起来肯定更容易 - 它实际上类似于普通CALL
,并且将旧int 0x80
调整为新SYSCALL
{1}}非常简单。
在这种情况下,系统调用的编号仍然在寄存器rax
中传递,但用于保存参数的寄存器已经发生严重变化,因为现在它们应按以下顺序使用:{{ 1}},rdi
,rsi
,rdx
,r10
和r8
。允许内核销毁寄存器r9
和rcx
的内容(它们用于保存r11
之外的其他寄存器。)
SYSCALL
请注意,实际上唯一需要更改的是寄存器名称和用于拨打电话的实际指令。这主要归功于gcc扩展的内联汇编语法提供的输入/输出列表,该语法自动提供执行指令列表所需的适当移动指令。
答案 1 :(得分:2)
显式寄存器变量
仅出于完整性考虑,我想提供一个使用GCC explicit register variables的示例。
此机制具有以下优点:
r8
,r9
和r10
S -> rsi
这样的单字母助记符更具可读性例如在glibc 2.29中使用寄存器变量,请参见:sysdeps/unix/sysv/linux/x86_64/sysdep.h
。
还要注意,其他拱门(例如ARM)已经完全删除了单字母助记符,而寄存器变量似乎是唯一的方法,例如:How to specify an individual register as constraint in ARM GCC inline assembly?
main_reg.c
#define _XOPEN_SOURCE 700
#include <inttypes.h>
#include <sys/types.h>
ssize_t my_write(int fd, const void *buf, size_t size) {
register int64_t rax __asm__ ("rax") = 1;
register int rdi __asm__ ("rdi") = fd;
register const void *rsi __asm__ ("rsi") = buf;
register size_t rdx __asm__ ("rdx") = size;
__asm__ __volatile__ (
"syscall"
: "+r" (rax)
: "r" (rdi), "r" (rsi), "r" (rdx)
: "cc", "rcx", "r11", "memory"
);
return rax;
}
void my_exit(int exit_status) {
register int64_t rax __asm__ ("rax") = 60;
register int rdi __asm__ ("rdi") = exit_status;
__asm__ __volatile__ (
"syscall"
: "+r" (rax)
: "r" (rdi)
: "cc", "rcx", "r11", "memory"
);
}
void _start(void) {
char msg[] = "hello world\n";
my_exit(my_write(1, msg, sizeof(msg)) != sizeof(msg));
}
编译并运行:
gcc -O3 -std=c99 -ggdb3 -ffreestanding -nostdlib -Wall -Werror \
-pedantic -o main_reg.out main_reg.c
./main.out
echo $?
输出
hello world
0
为进行比较,类似于How to invoke a system call via sysenter in inline assembly?的以下代码产生等效的程序集:
main_constraint.c
#define _XOPEN_SOURCE 700
#include <inttypes.h>
#include <sys/types.h>
ssize_t my_write(int fd, const void *buf, size_t size) {
ssize_t ret;
__asm__ __volatile__ (
"syscall"
: "=a" (ret)
: "0" (1), "D" (fd), "S" (buf), "d" (size)
: "cc", "rcx", "r11", "memory"
);
return ret;
}
void my_exit(int exit_status) {
ssize_t ret;
__asm__ __volatile__ (
"syscall"
: "=a" (ret)
: "0" (60), "D" (exit_status)
: "cc", "rcx", "r11", "memory"
);
}
void _start(void) {
char msg[] = "hello world\n";
my_exit(my_write(1, msg, sizeof(msg)) != sizeof(msg));
}
两者的拆卸:
objdump -d main_reg.out
几乎相同,这里是main_reg.c
:
Disassembly of section .text:
0000000000001000 <my_write>:
1000: b8 01 00 00 00 mov $0x1,%eax
1005: 0f 05 syscall
1007: c3 retq
1008: 0f 1f 84 00 00 00 00 nopl 0x0(%rax,%rax,1)
100f: 00
0000000000001010 <my_exit>:
1010: b8 3c 00 00 00 mov $0x3c,%eax
1015: 0f 05 syscall
1017: c3 retq
1018: 0f 1f 84 00 00 00 00 nopl 0x0(%rax,%rax,1)
101f: 00
0000000000001020 <_start>:
1020: c6 44 24 ff 00 movb $0x0,-0x1(%rsp)
1025: bf 01 00 00 00 mov $0x1,%edi
102a: 48 8d 74 24 f3 lea -0xd(%rsp),%rsi
102f: 48 b8 68 65 6c 6c 6f movabs $0x6f77206f6c6c6568,%rax
1036: 20 77 6f
1039: 48 89 44 24 f3 mov %rax,-0xd(%rsp)
103e: ba 0d 00 00 00 mov $0xd,%edx
1043: b8 01 00 00 00 mov $0x1,%eax
1048: c7 44 24 fb 72 6c 64 movl $0xa646c72,-0x5(%rsp)
104f: 0a
1050: 0f 05 syscall
1052: 31 ff xor %edi,%edi
1054: 48 83 f8 0d cmp $0xd,%rax
1058: b8 3c 00 00 00 mov $0x3c,%eax
105d: 40 0f 95 c7 setne %dil
1061: 0f 05 syscall
1063: c3 retq
因此,我们看到GCC内联了那些微小的syscall函数。
my_write
和my_exit
两者相同,但是_start
中的main_constraint.c
略有不同:
0000000000001020 <_start>:
1020: c6 44 24 ff 00 movb $0x0,-0x1(%rsp)
1025: 48 8d 74 24 f3 lea -0xd(%rsp),%rsi
102a: ba 0d 00 00 00 mov $0xd,%edx
102f: 48 b8 68 65 6c 6c 6f movabs $0x6f77206f6c6c6568,%rax
1036: 20 77 6f
1039: 48 89 44 24 f3 mov %rax,-0xd(%rsp)
103e: b8 01 00 00 00 mov $0x1,%eax
1043: c7 44 24 fb 72 6c 64 movl $0xa646c72,-0x5(%rsp)
104a: 0a
104b: 89 c7 mov %eax,%edi
104d: 0f 05 syscall
104f: 31 ff xor %edi,%edi
1051: 48 83 f8 0d cmp $0xd,%rax
1055: b8 3c 00 00 00 mov $0x3c,%eax
105a: 40 0f 95 c7 setne %dil
105e: 0f 05 syscall
1060: c3 retq
有趣的是,在这种情况下,GCC通过选择找到了一个稍短的等效编码:
104b: 89 c7 mov %eax,%edi
将fd
设置为1
,等于系统调用号中的1
,而不是更直接的方法:
1025: bf 01 00 00 00 mov $0x1,%edi
有关调用约定的深入讨论,另请参见:What are the calling conventions for UNIX & Linux system calls on i386 and x86-64
在Ubuntu 18.10,GCC 8.2.0中进行了测试。