了解汇编堆栈操作

时间:2013-04-10 22:29:28

标签: assembly arm bare-metal

我正在裸机ARM上编写sdram测试程序。我在C中编写它,但现在我想修改生成的程序集以防止程序使用sdram,这意味着除其他外,没有堆栈。

我最近开始学习ARM程序集,我不明白编译器生成的程序集是如何在以下代码中使用堆栈的(我没有通过阅读ARM ARM找到答案:/)。 32位变量值放在堆栈上,但为什么push在函数开头保留3次32位?有人可以在这里解释堆栈操作吗?

C代码:

/* ugly to have it as global but it reduces stack usage*/                                              
unsigned int const led_port[]= {0,0,1,1,2,2,3,3,4,4};
unsigned int const led_value_on[]={0x90,0x9,0x90,0x9,0x90,0x9,0x90,0x9,0x90,0x9};                      
unsigned int const masks[] = {0xf0,0xf,0xf0,0xf,0xf0,0xf,0xf0,0xf,0xf0,0xf};                           
unsigned int const led_value_off[]={0x80,0x8,0x80,0x8,0x80,0x8,0x80,0x8,0x80,0x8};                     

 void gbe_led_on(int i)
 {                        
         unsigned int value = 0;                                                                                
         phy_read(led_port[i], 0x10, &value);                                                                   
         value &= ~masks[i];
         value |= led_value_on[i];                                                                              
         phy_write(led_port[i], 0x10, value);
 }

生成的程序集(来自gcc-arm-elf):

     <gbe_led_off>:
push    {r4, r5, r6, lr}        /* ;reserve space on the stack for 3 32 bits variables + return address */
ldr     r5, [pc, #84]   ; ffff1578 <gbe_led_off+0x60>  /*r5=led_port (array base address) */
sub     sp, sp, #8              /* sp = sp-8 (decimal 8) what does it point to??*/
ldr     r4, [r5, r0, lsl #2]    /* r4 = *(led_port+i)&0x00ff, (shift from 16 bits) */
add     r2, sp, #8              /* r2 = sp+8 (decimal 8) why???*/
mov     r6, r0                  /* r6 = i */
mov     r3, #0                  /* r3 = 0 */
mov     r0, r4                  /* r0 = led_port[i]*/
str     r3, [r2, #-4]!          /* r3 = *(sp+8-4); update r2, to which value???*/
add     r5, r5, r6, lsl #2      /* r5 = led_port[i] & 0x00ff */
mov     r1, #16                 /* r1 = 16 (decimal) */
bl      ffff13f8 <phy_read>     /* call phy_read with arguments on r0, r1, r2*/
ldr     r1, [r5, #40]   ; 0x28  /* r1 = masks[i] */
ldr     r3, [sp, #4]            /* r3 = *(sp+4) ????*/
ldr     r2, [r5, #120]  ; 0x78  /* r2 = led_value_on[i] */
bic     r3, r3, r1              /* value &= masks[i] */
orr     r3, r3, r2              /* value |= led_value_on[i] */
mov     r0, r4                  /* r0 = led_port[i] */
mov     r2, r3                  /* r2 = value  */
mov     r1, #16                 /* r1 = 16    */  
str     r3, [sp, #4]            /* *(sp+4) = value; why do we do that???*/             
bl      ffff13cc <phy_write>    /* branch to phy_write with arguments on r0,r1,r2*/
add     sp, sp, #8              /* sp = sp+8 restore stack pointer before pop? */
pop     {r4, r5, r6, pc}        /* remove 4 bytes from the stack and branch to return address */
.word   0xffff1a30

1 个答案:

答案 0 :(得分:3)

推送是保存寄存器r4r5r6,所有这些都必须根据ARM编程模型保留。推送lr是为了保留返回地址,因为您正在调用将修改它的其他函数。堆栈中的sub 8保留另外8个字节的内存供其他变量使用(value变量) - 稍后在str r3, [2, #-4]行使用。此外,分支链接blphy_readphy_write也可能正在修改堆栈空间,因此堆栈内存的问题可能比您想象的要大。另外,关于4个字节的最后一个pop注释是不正确的 - 它是16个字节的空间被释放。

现在,您可以使用什么样的资源来使用RAM?你需要一些东西,否则你的unsigned int value将无法工作,更不用说你的电话了。你必须有一些东西可用。如果这样做,您可以通过链接描述文件和section指令告诉您的C程序,省去汇编程序的麻烦。