C代码:
long vframe(long n, long idx, long *q) {
long i;
long *p[n];
p[0] = &i;
for (i = 1; i < n; i++)
p[i] = q;
return *p[idx];
}
部分生成的汇编代码:
long vframe(long n, long idx, long *q)
n in %rdi, idx in %rsi, q in %rdx
Only portions of code shown
vframe:
pushq %rbp Save old %rbp
movq %rsp, %rbp Set frame pointer
subq $16, %rsp Allocate space for i (%rsp = s1)
leaq 22(,%rdi,8), %rax
andq $-16, %rax
subq %rax, %rsp Allocate space for array p (%rsp = s2)
leaq 7(%rsp), %rax
shrq $3, %rax
leaq 0(,%rax,8), %r8 Set %r8 to &p[0]
movq %r8, %rcx Set %rcx to &p[0] (%rcx = p)
...
Code for initialization loop
i in %rax and on stack, n in %rdi, p in %rcx, q in %rdx
.L3: loop:
movq %rdx, (%rcx,%rax,8) Set p[i] to q
addq $1, %rax Increment i
movq %rax, -8(%rbp) Store on stack
.L2:
movq -8(%rbp), %rax Retrieve i from stack
cmpq %rdi, %rax Compare i:n
jl .L3 If <, goto loop
...
Code for function exit
leave Restore %rbp and %rsp
ret Return
书中作者说:
中的leaq
指令
leaq 22(,%rdi,8), %rax
计算值8n + 22
,然后通过{p>中的16
指令将其舍入到andq
的最接近倍数。
andq $-16, %rax
当 8n + 8
为奇数时,结果值为n
;当 8n + 16
为偶数时,结果值为n
,并从s1
中减去该值以得出s2
。
让我感到困惑的是8n + 22
。为什么必须是22
,而不是16, 17, 18, 19, 20, 21, 23
?
答案 0 :(得分:1)
现在我在这里阅读时,我也遇到这个问题。
然后我尝试用clang
用以下命令来编译源代码:
clang -Og -S source.c -o source.s
在平台ubuntu18.04和Windows 10中,
汇编文件显示:
pushq %rbp
movq %rsp, %rbp
subq $16, %rsp
movq %rsp, %r8
movq %rsp, %r9
leaq 15(,%rdi,8), %r10
andq $-16, %r10
movq %r9, %rax
...
clang
从16到23之间选择15,甚至不选择。
我读了The x86-64 psABI version 1.0,
在3.2.2 The Stack Frame
部分:
输入参数区域的末尾应对齐16(32或64,如果 __m256或__m512在堆栈上传递)字节边界。换句话说,价值 (%rsp + 8)始终是控制权转移到16的倍数(32或64) 功能入口点。堆栈指针%rsp始终指向 最新分配的堆栈帧。
所以我认为数字是22
或15
并不重要,
数字仅导致e1
和e2
的大小
clang
选择15
,然后在n
为偶数时,e1
和e2
将小于gcc
版本,
关键是要保护16个字节与堆栈帧的末尾对齐,
或可变大小堆栈帧中s2 - s1
的值。