我今天开始通过分析对应于这个c ++示例的汇编代码来学习x86汇编(我知道存在类似atoi
的东西,但我想保持示例最小化):
#include <vector>
std::vector<int> range(int N) {
std::vector<int> v(N);
for (unsigned int i = 0; i < N; ++i)
v[i] = i;
return v;
}
int main() {
return range(100).back();
}
如果使用g++ -O0 -S -fno-stack-protector return_by_value.cpp
进行编译,则会产生以下摘录:
... <snip>
_Z5rangei:
.LFB509:
.cfi_startproc
.cfi_personality 0x3,__gxx_personality_v0
.cfi_lsda 0x3,.LLSDA509
pushq %rbp
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
movq %rsp, %rbp
.cfi_def_cfa_register 6
pushq %rbx
subq $40, %rsp
.cfi_offset 3, -24
movq %rdi, -40(%rbp)
movl %esi, -44(%rbp)
leaq -25(%rbp), %rax
movq %rax, %rdi
call _ZNSaIiEC1Ev
movl $0, -24(%rbp)
movl -44(%rbp), %eax
movslq %eax, %rsi
leaq -25(%rbp), %rcx
leaq -24(%rbp), %rdx
... <snip>
我很惊讶地看到奇数(即不是8的多个)偏移:leaq -25(%rbp), %rax
,特别是因为它是q
指令而且我们还有-24(%rbp)
。 编译器读取8字节边界的原因是什么?
答案 0 :(得分:10)
看看这个片段:
leaq -25(%rbp), %rax
movq %rax, %rdi
call _ZNSaIiEC1Ev
_ZNSaIiEC1Ev
已解除为std::allocator<int>::allocator()
,因此-25(%rbp)
是传递给构造函数的allocator<int>
对象的地址。如果我们在GCC中打印此对象的sizeof
,我们将得到1.由于对象的大小为1,因此无需将其与8个字节对齐,并且可以将其放在任何内存地址中。
稍后看到的-24(%rbp)
是另一个对象的地址,编译器不会读取8字节的边界。
请注意,lea
指令实际上并不访问内存 - 它只计算一个地址。因此,它具有q
后缀的事实并不意味着它访问8个字节。