Question

C代码：

long vframe(long n, long idx, long *q) {
    long i;
    long *p[n];
    p[0] = &i;

    for (i = 1; i < n; i++)
        p[i] = q;

    return *p[idx];
}

部分生成的汇编代码：

long vframe(long n, long idx, long *q)

n in %rdi, idx in %rsi, q in %rdx
Only portions of code shown
vframe:
pushq   %rbp            Save old %rbp
movq    %rsp, %rbp      Set frame pointer
subq    $16, %rsp       Allocate space for i (%rsp = s1)
leaq    22(,%rdi,8), %rax
andq    $-16, %rax
subq    %rax, %rsp      Allocate space for array p (%rsp = s2)
leaq    7(%rsp), %rax
shrq    $3, %rax
leaq    0(,%rax,8), %r8     Set %r8 to &p[0]
movq    %r8, %rcx       Set %rcx to &p[0] (%rcx = p)
...
Code for initialization loop
i in %rax and on stack, n in %rdi, p in %rcx, q in %rdx
.L3:                  loop:
movq    %rdx, (%rcx,%rax,8) Set p[i] to q
addq    $1, %rax        Increment i
movq    %rax, -8(%rbp)      Store on stack
.L2:
movq    -8(%rbp), %rax      Retrieve i from stack
cmpq    %rdi, %rax      Compare i:n
jl  .L3         If <, goto loop
...
Code for function exit
leave               Restore %rbp and %rsp
ret             Return

书中作者说：

中的leaq指令

leaq    22(,%rdi,8), %rax

计算值8n + 22，然后通过{p>中的16指令将其舍入到andq的最接近倍数。

andq    $-16, %rax

当 8n + 8为奇数时，结果值为n；当 8n + 16为偶数时，结果值为n ，并从s1中减去该值以得出s2。

让我感到困惑的是8n + 22。为什么必须是22，而不是16, 17, 18, 19, 20, 21, 23？

Answer 1

现在我在这里阅读时，我也遇到这个问题。

然后我尝试用clang用以下命令来编译源代码：

clang -Og -S source.c -o source.s

在平台ubuntu18.04和Windows 10中，

汇编文件显示：

pushq   %rbp
movq    %rsp, %rbp
subq    $16, %rsp
movq    %rsp, %r8
movq    %rsp, %r9
leaq    15(,%rdi,8), %r10
andq    $-16, %r10
movq    %r9, %rax
     ...

clang从16到23之间选择15，甚至不选择。

我读了The x86-64 psABI version 1.0，

在3.2.2 The Stack Frame部分：

输入参数区域的末尾应对齐16（32或64，如果 __m256或__m512在堆栈上传递）字节边界。换句话说，价值（％rsp + 8）始终是控制权转移到16的倍数（32或64）功能入口点。堆栈指针％rsp始终指向最新分配的堆栈帧。

所以我认为数字是22或15并不重要，

数字仅导致e1和e2的大小

clang选择15，然后在n为偶数时，e1和e2将小于gcc版本，

关键是要保护16个字节与堆栈帧的末尾对齐，

或可变大小堆栈帧中s2 - s1的值。

关于可变大小的堆栈框架，关于堆栈框架的对齐，来自CSAPP的示例

1 个答案: