我把这个问题归结为一个小例子。这是我使用的(在foo.ll中)的LLVM汇编程序代码:
target datalayout = "e-p:64:64:64-S128-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f16:16:16-f32:32:32-f64:64:64-f128:128:128-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64"
target triple = "x86_64-pc-linux-gnu"
define fastcc i32 @foo(i32) {
entry:
%x = add i32 %0, 1
ret i32 %x
}
define i32 @main(i32, i8**) {
entry:
%2 = call i32 @foo(i32 %0)
ret i32 %2
}
然后我编译:
clang -O1 -o foo foo.ll
......当我跑步时,我得到:
Illegal instruction (core dumped)
...所以我启动了我的调试器,看到了这个:
Program received signal SIGILL, Illegal instruction.
0x00000000004004d0 in main ()
(gdb) bt
#0 0x00000000004004d0 in main ()
(gdb) disas
Dump of assembler code for function main:
=> 0x00000000004004d0 <+0>: ud2
End of assembler dump.
(gdb)
请注意,如果我更改以下任何一项,程序执行正常:
供参考,&#34; clang -v&#34;是:
clang version 3.3 (tags/RELEASE_33/final)
Target: x86_64-unknown-linux-gnu
Thread model: posix
答案 0 :(得分:4)
您的被叫方被标记为“fastcall”,但呼叫不是。调用约定需要匹配,否则它是未定义的行为,而这些行为又被优化为“ud2”,或者根本没有。这是一个常见问题:http://llvm.org/docs/FAQ.html#why-does-instcombine-simplifycfg-turn-a-call-to-a-function-with-a-mismatched-calling-convention-into-unreachable-why-not-make-the-verifier-reject-it
答案 1 :(得分:1)
有一个错误,在优化函数调用时,clang会产生一个未定义的指令ud2(会引发无效的操作码错误),表明它无法处理。
基本上,为了加快速度,它将返回值放在寄存器中。如果返回值不适合寄存器(因此将在堆栈中返回),那么它将发出ud2而不是ret,而是发出一个ud2。
这是一个已知的错误(至少在3.2中)。