如何编写发出特定于体系结构的系统调用指令所需的LLVM bitcode? p>
更具体地说,clang
支持内联汇编,并且明确支持发出系统调用(否则无法编译libc
和vdso
)。翻译如何为此工作,以及如何让它重现这种行为呢?
我理解LLVM本身可能无法以足够高级的方式理解各种体系结构使用的调用接口和寄存器调度,以在LLVM字节码中表示(例如,可以在其他地方填写)。但是,显然这个信息可以添加。
我该如何做到这一点,从#34; C源内联汇编后的任何阶段开始"?
令人满意的答案将包括如何调用五参数int 0x80
系统调用的示例。我选择五个,因为它需要溢出到堆栈,我选择int 0x80
,因为它很容易理解,并且在最常见的平台上。
答案 0 :(得分:6)
在这里发布答案,因为exa已经获得了赏金。
我意识到在Ross Ridge的评论之后提出这个问题有些愚蠢,有些人还在玩铿锵声。
假设我们有以下程序,它使用内联汇编直接调用write()
。
#include <stdio.h>
int main(void)
{
char *buf = "test\n";
ssize_t n;
asm volatile (
"movl $0x00000002, %%edi\n" /* first argument == stderr */
"movl $0x00000006, %%edx\n" /* third argument == number of bytes */
"movl $1, %%eax\n" /* syscall number == write on amd64 linux */
"syscall\n"
: "=A"(n) /* %rax: return value */
: "S"(buf)); /* %rsi: second argument == address of data to write */
return n;
}
我们可以使用gcc
或clang
进行编译,并获得大致相同的结果。
$ gcc -o syscall.gcc syscall.c
$ clang -o syscall.clang syscall.c
$ ./syscall.gcc
test
$ ./syscall.clang
test
如果我们希望看到用于发出此代码的确切LLVM指令,我们可以简单地使用-emit-llvm
标志。如您所见,有一条call i64 asm sideeffect
行,其中包含完整的内联汇编字符串。
$ clang -S -emit-llvm syscall.c
$ cat syscall.ll
; ModuleID = 'syscall.c'
target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
target triple = "x86_64-pc-linux-gnu"
@.str = private unnamed_addr constant [6 x i8] c"test\0A\00", align 1
; Function Attrs: nounwind uwtable
define i32 @main() #0 {
%1 = alloca i32, align 4
%buf = alloca i8*, align 8
%n = alloca i64, align 8
store i32 0, i32* %1
store i8* getelementptr inbounds ([6 x i8]* @.str, i32 0, i32 0), i8** %buf, align 8
%2 = load i8** %buf, align 8
%3 = call i64 asm sideeffect "movl $$0x00000002, %edi\0Amovl $$0x00000006, %edx\0Amovl $$1, %eax\0Asyscall\0A", "=A,{si},~{dirflag},~{fpsr},~{flags}"(i8* %2) #1, !srcloc !1
store i64 %3, i64* %n, align 8
%4 = load i64* %n, align 8
%5 = trunc i64 %4 to i32
ret i32 %5
}
attributes #0 = { nounwind uwtable "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-nans-fp-math"="false" "stack-protector-buffer-size"="8" "unsafe-fp-math"="false" "use-soft-float"="false" }
attributes #1 = { nounwind }
!llvm.ident = !{!0}
!0 = metadata !{metadata !"Ubuntu clang version 3.5-1ubuntu1 (trunk) (based on LLVM 3.5)"}
!1 = metadata !{i32 134, i32 197, i32 259, i32 312}