关于可变大小的堆栈框架,关于堆栈框架的对齐,来自CSAPP的示例

时间:2018-07-30 11:11:59

标签: c gcc assembly x86-64 att

C代码:

long vframe(long n, long idx, long *q) {
    long i;
    long *p[n];
    p[0] = &i;

    for (i = 1; i < n; i++)
        p[i] = q;

    return *p[idx];
}

部分生成的汇编代码:

long vframe(long n, long idx, long *q)

n in %rdi, idx in %rsi, q in %rdx
Only portions of code shown
vframe:
pushq   %rbp            Save old %rbp
movq    %rsp, %rbp      Set frame pointer
subq    $16, %rsp       Allocate space for i (%rsp = s1)
leaq    22(,%rdi,8), %rax
andq    $-16, %rax
subq    %rax, %rsp      Allocate space for array p (%rsp = s2)
leaq    7(%rsp), %rax
shrq    $3, %rax
leaq    0(,%rax,8), %r8     Set %r8 to &p[0]
movq    %r8, %rcx       Set %rcx to &p[0] (%rcx = p)
...
Code for initialization loop
i in %rax and on stack, n in %rdi, p in %rcx, q in %rdx
.L3:                  loop:
movq    %rdx, (%rcx,%rax,8) Set p[i] to q
addq    $1, %rax        Increment i
movq    %rax, -8(%rbp)      Store on stack
.L2:
movq    -8(%rbp), %rax      Retrieve i from stack
cmpq    %rdi, %rax      Compare i:n
jl  .L3         If <, goto loop
...
Code for function exit
leave               Restore %rbp and %rsp
ret             Return

书中作者说:

中的leaq指令

leaq    22(,%rdi,8), %rax

计算值8n + 22,然后通过{p>中的16指令将其舍入到andq的最接近倍数。

andq    $-16, %rax

8n + 8为奇数时,结果值为n;当 8n + 16为偶数时,结果值为n ,并从s1中减去该值以得出s2

让我感到困惑的是8n + 22。为什么必须是22,而不是16, 17, 18, 19, 20, 21, 23

1 个答案:

答案 0 :(得分:1)

现在我在这里阅读时,我也遇到这个问题。

然后我尝试用clang用以下命令来编译源代码:

  

clang -Og -S source.c -o source.s

在平台ubuntu18.04和Windows 10中,

汇编文件显示:

pushq   %rbp
movq    %rsp, %rbp
subq    $16, %rsp
movq    %rsp, %r8
movq    %rsp, %r9
leaq    15(,%rdi,8), %r10
andq    $-16, %r10
movq    %r9, %rax
     ...

clang从16到23之间选择15,甚至不选择。

我读了The x86-64 psABI version 1.0

3.2.2 The Stack Frame部分:

  

输入参数区域的末尾应对齐16(32或64,如果   __m256或__m512在堆栈上传递)字节边界。换句话说,价值   (%rsp + 8)始终是控制权转移到16的倍数(32或64)   功能入口点。堆栈指针%rsp始终指向   最新分配的堆栈帧。

所以我认为数字是2215并不重要,

数字仅导致e1e2的大小

clang选择15,然后在n为偶数时,e1e2将小于gcc版本,

关键是要保护16个字节与堆栈帧的末尾对齐,

或可变大小堆栈帧中s2 - s1的值。