Question

我想更好地理解堆栈和堆的工作原理。在比较同一程序的32位和64位编译版本时，我遇到了麻烦。在这两种情况下，我都使用了一个来宾Fedora 15 VM（32和64），gcc用于编译，gdb用于调试，以及相同的主机硬件。有问题的程序非常简单，紧接着如下：

C程序

void function(int a, int b, int c, int d){
    int value;
    char buffer[10];

    value = 1234;
    buffer[0] = 'A';
}

int main(){
    function(1, 2, 3, 4);
}

为了空间利益，我省略了程序的汇编转储;但是，如果有人认为这可能有助于他们回答我的问题，我很乐意将其纳入其中。

32位编译程序：

首先将参数4（0xbffff3e4），3（0xbffff3e0），2（0xbffff3dc）和1（0xbffff3d8）压入堆栈。接下来，指令跟随调用function（） - 或返回地址 - 的位置放在堆栈（0x080483d1）上。接下来，前一个堆栈（0xbffff3e8）的基指针的值被推送到堆栈。

(gdb) x/16xw $esp
0xbffff3c0: 0x00000000  0x410759c3  0x4105d237  0x00000000
0xbffff3d0: 0xbffff3e8  0x080483d1  0x00000001  0x00000002//pointers
0xbffff3e0: 0x00000003  0x00000004  0x00000000  0x4105d413//followed by params
0xbffff3f0: 0x00000001  0xbffff484  0xbffff48c  0x41040fc4

64位编译程序：

然而;这里没有看到值4,3,2和1。所有我能看到的，无论我看到的堆栈多远，都是返回地址（0x4004ae）和先前堆栈帧的基指针（0x7fffffffe210）。

(gdb) x/16xg $rsp
0x7fffffffe200: 0x00007fffffffe210  0x00000000004004ae //pointers
0x7fffffffe210: 0x0000000000000000  0x00000036d042139d
0x7fffffffe220: 0x0000000000000000  0x00007fffffffe2f8
0x7fffffffe230: 0x0000000100000000  0x0000000000400491
0x7fffffffe240: 0x0000000000000000  0x7ade47f577d82f75
0x7fffffffe250: 0x0000000000400390  0x00007fffffffe2f0
0x7fffffffe260: 0x0000000000000000  0x0000000000000000
0x7fffffffe270: 0x8521b80ab3982f75  0x7ab3e77151682f75

带有print语句的

64位编译程序：

现在，在添加一个简单的print语句之后：

printf("%d, %c\n", flag, buffer[0]);

在function（）中，我可以看到任意参数（见下文，0x7fffffffe1e0-0x7fffffffe1ec）。我还可以看到前一个堆栈帧的基本指针，0x7fffffffe210（在0x7fffffffe200中）和返回地址0x400520（在0x7fffffffe208中）。我认为由于新的印刷声明而改变了。 在这种情况下，如果没有打印声明，为什么4,3,2和1不可见？ gcc编译器的64位实现是否足够智能，不会“浪费”内存中从未使用过的参数和局部变量？

(gdb) x/16xg $rsp
0x7fffffffe1e0: 0x0000000300000004  0x0000000100000002 //parameters
0x7fffffffe1f0: 0x0000000000000000  0x00000000004003e0
0x7fffffffe200: 0x00007fffffffe210  0x0000000000400520 //pointers
0x7fffffffe210: 0x0000000000000000  0x00000036d042139d
0x7fffffffe220: 0x0000000000000000  0x00007fffffffe2f8
0x7fffffffe230: 0x0000000100000000  0x0000000000400503
0x7fffffffe240: 0x0000000000000000  0xd3c0c92559feaed9
0x7fffffffe250: 0x00000000004003e0  0x00007fffffffe2f0

最后，为什么32位操作系统将参数4,3,2和1 高放在堆栈中，而不是前面提到的指针。为什么64位操作系统会将参数 lower 放在堆栈中而不是指针？我的印象是传递的参数总是先放在堆栈上（因此，因为堆栈向较小的地址增长，所以存在于较大值的存储器地址中。然后是保存的基指针和返回地址（因此基指针可以重置为其先前的值，并且可以返回调用函数）。这是我在32位编译代码中观察到的行为，但不是64位版本。我有什么误会？如果我的问题不清楚，我感谢对此事的任何见解并道歉。请让我知道任何方式我可以更简洁（或者如果我在任何时候都是不正确的。）

提前谢谢。

Answer 1

64-bit ABI used by Linux与32位ABI有很大不同：在64位世界中，参数通常在寄存器中传递，而不是在堆栈中传递。

在添加printf()之前，您没有在堆栈上找到参数，因为第一个（最多）6个整数或指针参数在寄存器中传递（按%rdi，{{ 1}}，%rsi，%rdx，%rcx，%r8）。

添加%r9之后，它们可能会在注册内容被拖曳到printf()调用的过程中保存在堆栈中 - 看一下程序集;一旦你知道ABI是什么样子，它就显而易见了。

为什么本程序的32位和64位编译版本以这种方式填充内存？

C程序

32位编译程序：

64位编译程序：

64位编译程序：

1 个答案: