我正在读的这本书说这个函数有一个局部变量。它还说具有此函数的局部变量很重要,因为它是递归的。也许我只是盲目或者我不明白局部变量如何在装配中起作用,但我没有看到它。
.type factorial, @function
factorial:
push %rbp # Save old base pointer.
mov %rsp, %rbp # Copy stack pointer to base pointer.
mov 16(%rbp), %rax # Save the argument in %rax.
cmp $1, %rax # End of the factorial.
je end_factorial
dec %rax # Decrement %rax.
push %rax # Push onto stack for next call to factorial.
call factorial
mov 16(%rbp), %rbx # %rax has return value, so load arg into %rbx.
imul %rbx, %rax # Multiply that by result of last call to factorial.
end_factorial:
# Restore stack pointer and base pointer to where they were
# before function call.
mov %rbp, %rsp
pop %rbp
ret
寄存器可以被视为局部变量吗?我虽然局部变量是用sub $8, %rsp
。
答案 0 :(得分:2)
局部变量不是通过它们的实现来定义的,而是通过它们的语义定义的。
变量是 local ,如果函数的每次调用都获得该变量的独立值,那就是为什么你可以说变量的值是“函数的本地”。
由于这种行为可以通过使用寄存器来实现,这是一个非常有效的实现。
但是,由于某些寄存器被认为是调用者保存的,因此在调用嵌套函数之前可能必须将值放在堆栈上,否则值将丢失。从嵌套调用返回到原始函数后,该值可以从堆栈中恢复到寄存器中。
正如已经提到的,访问寄存器比访问堆栈快得多。因此,只要有可能,它们都优先于主存储器。
但是,我不知道为什么在没有额外的移动操作的情况下它不能只做imul 16(%rbp), %rax
。毕竟,imul
指令允许源操作数在内存中。
答案 1 :(得分:1)
寄存器是放置局部变量的完美有效位置。实际上,它最好是内存,因为访问速度要快得多。我修改了我的LLVM演示页面,以便在http://ellcc.org/demo/编译这个因子算法。对于x86-64,它提出了
.file "/tmp/webcompile/_23578_0.c"
.text
.globl fact
.align 16, 0x90
.type fact,@function
fact: # @fact
.cfi_startproc
# BB#0: # %entry
movl $1, %eax
cmpq $2, %rdi
jl .LBB0_2
.align 16, 0x90
.LBB0_1: # %if.end
# =>This Inner Loop Header: Depth=1
imulq %rdi, %rax
decq %rdi
cmpq $1, %rdi
jg .LBB0_1
.LBB0_2: # %return
ret
.Ltmp0:
.size fact, .Ltmp0-fact
.cfi_endproc
请注意,在这种情况下,编译器会删除递归并仅使用寄存器进行计算。