在损坏的堆栈触发时捕获SIGSEGV

时间:2016-09-02 16:41:54

标签: c linux signals sigsegv sigaction

我一直在研究一些有缺陷的代码,并希望安装一个SIGSEGV处理程序来获取有关崩溃的更多信息。但是,我注意到我的处理程序没有被调用。

我一直在寻找一个理由,它似乎与损坏的堆栈指针值有关(它肯定没有被屏蔽)。这是我编写的一些概念验证代码,用于验证:

static void catch_function(int sig, siginfo_t *info, void *cntxt)
{
    puts("handler works");
}

void main(int argc, char **argv)
{    
    struct sigaction sa;

    sa.sa_sigaction = (void *)catch_function;
    sigemptyset (&sa.sa_mask);
    sa.sa_flags = SA_SIGINFO | SA_NODEFER ;

    sigaction(SIGSEGV, &sa, NULL);

    puts("testing handler");
    raise(SIGSEGV);
    puts("back");

    __asm__ (   "xor %rax, %rax\n\t"
                "mov %rax, %rsp\n\t"
                "push 0" 
            );

    // never reached...
}

想法是将RSP设置为0(无效偏移),然后将其用于某些事情。但是,第二个SIGSEGV不会被处理程序捕获,而是终止进程。

显然,调用信号处理程序需要一个合理的堆栈指针 - 但为什么呢?这不符合处理信号的想法吗?有没有机会绕过这个?

我正在运行Linux 3.19.0-25版 - 通用。

1 个答案:

答案 0 :(得分:1)

好的,这是EOF注释后的上述问题的解决方案(使用sigaltstack()在堆上提供信号堆栈):

#include <stdio.h>

#define __USE_GNU
#include <signal.h>
#include <stdlib.h>
#include <ucontext.h>

static long long int sbase;

static void catch_function(int sig, siginfo_t *info, void *cntxt)
{
    puts("handler works");

    /* reset RSP if invalid */
    ucontext_t *uc_context = (ucontext_t *)cntxt;
    if(!uc_context->uc_mcontext.gregs[REG_RSP])
    {
        puts("resetting RSP");
        uc_context->uc_mcontext.gregs[REG_RSP] = sbase;
    }
}

void main(int argc, char **argv)
{    
    /* RSP during main */
    sbase = (long long int)&argv;

    stack_t ss;
    struct sigaction sa;

    ss.ss_sp = malloc(SIGSTKSZ);
    ss.ss_size = SIGSTKSZ;
    ss.ss_flags = 0;
    sigaltstack(&ss, NULL);  

    sa.sa_sigaction = (void *)catch_function;
    sigemptyset (&sa.sa_mask);
    sa.sa_flags = SA_SIGINFO | SA_NODEFER | SA_ONSTACK;

    sigaction(SIGSEGV, &sa, NULL);

    puts("testing handler");
    raise(SIGSEGV);
    puts("back");

    __asm__ (
            "xor %rax, %rax\n\t"
            "mov %rax, %rsp\n\t"
            "push %rax\n\t"
            "pop %rax"  );

    puts("exiting.");
}

替代信号堆栈在堆上分配,并使用sigaltstack(&ss,NULL)进行注册。此外,SA_ONSTACK结构中设置了sigaction标志,以便为此特定操作启用备用堆栈。

这基本上解决了我的问题,因为现在我们看到了无休止的SIGSEGV被抓住了。毕竟,上面的catch_function()对修复无效的堆栈指针没有太大作用。作为一个解决方案,我现在将main()中的sbase的有效堆栈指针存储在DELETE FROM Lines L INNER JOIN (SELECT DocumentNumber,LineNumber,SheetNumber,Unit, COUNT(*) FROM Lines GROUP BY DocumentNumber,LineNumber,SheetNumber,Unit HAVING COUNT(*) > 1) D ON L.DocumentNumber = D.DocumentNumber AND L.LineNumber = D.LineNumber AND L.SheetNumber = D.SheetNumber AND L.Unit = D.Unit 中,如果它无效(通过操纵已保存的线程上下文),则使用该指针在处理程序中恢复它。

为了完成所有这些工作,我还修改了我的内联汇编,不仅仅是推送一个值,而且之后又将其弹回,因此堆栈高度保持不变。为了可复制性,我还包括了这次的包含。