setjmp和longjmp实现

时间:2017-09-07 10:48:54

标签: c++ assembly x86 clang++

基本上我的问题很简单就是我对setjmp和longjmp的实现 不起作用。我之所以要求这种形式不在(代码审查)中的原因是我是大会新手我没有什么背景但仍在学习但仍不确定代码(请阅读直到最后)。

首先我在两个平台上用三个不同的编译器执行代码 这就是为什么我确定我对汇编程序做错了。

平台:mac OS 10.12.5 x86_64,ubuntu linux x86 编译器:Apple LLVM clang 8.0.0 x86_x64,clang 3.9.1 x86_x64,gcc 6.3 x86

我已经在所有平台上以32位模式编译代码,因此使用此示例在linux和mac上生成的机器代码为32位。

我将在这里发布的代码是在Apple clang下编译的,没有使用-m32标志进行优化以生成32位机器代码

 #include <cstdio>


typedef unsigned long jmp_buf[6];


int Setjmp(jmp_buf var){
     __asm__(
             "    mov -4(%ebp), %eax     # get pointer to jmp_buf, passed as argument on stack\n"
             "    mov    %ebx, (%eax)   # jmp_buf[0] = ebx\n"
             "    mov    %esi, 4(%eax)  # jmp_buf[1] = esi\n"
             "    mov    %edi, 8(%eax)  # jmp_buf[2] = edi\n"
             "    mov    %ebp, 12(%eax) # jmp_buf[3] = ebp\n"
             "    lea   4(%esp), %ecx     # get previous value of esp, before call\n"
             "    mov    %ecx, 16(%eax) # jmp_buf[4] = esp before call\n"
             "    mov  (%esp), %ecx     # get saved caller eip from top of stack\n"
             "    mov    %ecx, 20(%eax) #jmp_buf[5] = saved eip\n"
             "    xor    %eax, %eax     #eax = 0\n"
     );

    return 0;
}

void Longjmp(jmp_buf var,int m){
    __asm__("    mov  -4(%ebp),%edx # get pointer to jmp_buf, passed as argument 1 on stack\n"
            "    mov  -8(%ebp),%eax #get int val in eax, passed as argument 2 on stack\n"
            "    test    %eax,%eax # is int val == 0?\n"
            "    jnz 1f\n"
            "    inc     %eax      # if so, eax++\n"
            "1:\n"
            "    mov   (%edx),%ebx # ebx = jmp_buf[0]\n"
            "    mov  4(%edx),%esi # esi = jmp_buf[1]\n"
            "    mov  8(%edx),%edi #edi = jmp_buf[2]\n"
            "    mov 12(%edx),%ebp # ebp = jmp_buf[3]\n"
            "    mov 16(%edx),%ecx # ecx = jmp_buf[4]\n"
            "    mov     %ecx,%esp # esp = ecx\n"
            "    mov 20(%edx),%ecx # ecx = jmp_buf[5]\n"
            "    jmp *%ecx         # eip = ecx");
}



void fancy_func(jmp_buf env);

int main() {
    jmp_buf env;
    int ret = Setjmp(env);
    if (ret == 0) {
        puts("just returning from setjmp!");
        fancy_func(env);
    } else {
        puts("now returning from longjmp and exiting!");
    }

}

void fancy_func(jmp_buf env) {
    puts("doing fancy stuff");
    Longjmp(env, 1);
}

我正在关注本教程:http://vmresu.me/blog/2016/02/09/lets-understand-setjmp-slash-longjmp/

注意:我调试了源代码,问题来自:

 jmp *%ecx

但我认为问题在于setjmp以及我存储上下文的方式 特别是那条线:

 lea   4(%esp), %ecx     # get previous value of esp, before call\n"

这也是我没有得到的代码的一部分。

我也知道我的编译器为调用和清理setjmp和longjmp的堆栈以及在我的情况下使用的调用约定(CDECL)而生成的代码。

非常感谢你的帮助。

1 个答案:

答案 0 :(得分:2)

这有很多问题。正如fuz所说,你不应该像这样使用内联汇编。使用单独的asm文件,或者至少是约束,最好不要依赖于特定的堆栈布局。

无论如何,你得到的偏移是错误的,参数是偏离ebp而不是负数,首先是8(%ebp)。此外,由于4(%esp)已保存(%esp),因此返回地址错误,位于ebp。此外,由于功能序言已保存ebp,因此您不会保存来电者ebp,而是保存esp的副本。

固定版本(仍然只能在32位模式下用于调用带有堆栈参数的约定):

查看整个函数on the Godbolt compiler explorer

的结果asm
// optimize("no-omit-frame-pointer") doesn't seem to work
// we still don't get a frame-point unless we force -O0 for the function with optimize(0)
__attribute__((noinline, noclone, returns_twice, optimize(0)))
int Setjmp(jmp_buf var){
    // relies on the compiler to make a stack-frame
    // because we're using inline asm inside a function instead of at global scope
     __asm__(
             "    mov 8(%ebp), %eax     # get pointer to jmp_buf, passed as argument on stack\n"
             "    mov    %ebx, (%eax)   # jmp_buf[0] = ebx\n"
             "    mov    %esi, 4(%eax)  # jmp_buf[1] = esi\n"
             "    mov    %edi, 8(%eax)  # jmp_buf[2] = edi\n"
             "    mov    (%ebp), %ecx\n"
             "    mov    %ecx, 12(%eax) # jmp_buf[3] = ebp\n"
             "    lea    8(%ebp), %ecx  # get previous value of esp, before call\n"
             "    mov    %ecx, 16(%eax) # jmp_buf[4] = esp before call\n"
             "    mov    4(%ebp), %ecx  # get saved caller eip from top of stack\n"
             "    mov    %ecx, 20(%eax) #jmp_buf[5] = saved eip\n"
             "    xor    %eax, %eax     #eax = 0\n"
     );

    return 0;
}

__attribute__((noinline, noclone, optimize(0)))
void Longjmp(jmp_buf var,int m){
    __asm__("    mov  8(%ebp),%edx # get pointer to jmp_buf, passed as argument 1 on stack\n"
            "    mov  12(%ebp),%eax #get int val in eax, passed as argument 2 on stack\n"
            "    test    %eax,%eax # is int val == 0?\n"
            "    jnz 1f\n"
            "    inc     %eax      # if so, eax++\n"
            "1:\n"
            "    mov   (%edx),%ebx # ebx = jmp_buf[0]\n"
            "    mov  4(%edx),%esi # esi = jmp_buf[1]\n"
            "    mov  8(%edx),%edi #edi = jmp_buf[2]\n"
            "    mov 12(%edx),%ebp # ebp = jmp_buf[3]\n"
            "    mov 16(%edx),%ecx # ecx = jmp_buf[4]\n"
            "    mov     %ecx,%esp # esp = ecx\n"
            "    mov 20(%edx),%ecx # ecx = jmp_buf[5]\n"
            "    jmp *%ecx         # eip = ecx");
}

如果您在全局范围内使用asm语句,则不需要使用__attribute__内容来对抗编译器,以确保它会发出您期望的序言。您也可以跳过设置EBP,以便直接获得来电者的EBP。

asm(".globl SetJmp \n"
    "SetJmp:       \n\t"
    "   push   %ebp  \n\t"
    "   mov    %esp, %ebp  \n\t"

    "...  your current implementation    \n\t"

    "   xor    %eax,%eax   \n\t"
    "   pop    %ebp        \n\t"
    "   ret                \n\t"
 );