来自main的C函数没有推动堆栈

时间:2017-09-12 23:11:21

标签: c gcc assembly arm cortex-m3

我正在为stm32l152C-discovery board执行arm cortex-m3的C代码,但我发现main的函数调用没有被推入堆栈。我已经分析了这个源代码的asm代码,但我发现它没问题。要更好地理解,请在此处查看为C代码生成的asm代码:

main.elf:     file format elf32-littlearm

*SYMBOL TABLE:
00000010 l    d  .text  00000000 .text
00000000 l    d  .debug_info    00000000 .debug_info
00000000 l    d  .debug_abbrev  00000000 .debug_abbrev
00000000 l    d  .debug_aranges 00000000 .debug_aranges
00000000 l    d  .debug_line    00000000 .debug_line
00000000 l    d  .debug_str 00000000 .debug_str
00000000 l    d  .comment   00000000 .comment
00000000 l    d  .ARM.attributes    00000000 .ARM.attributes
00000000 l    d  .debug_frame   00000000 .debug_frame
00000000 l    df *ABS*  00000000 main.c
00000000 l    df *ABS*  00000000 clock.c
20004ffc g       .text  00000000 _STACKTOP
**00000028 g     F .text    000000e0 SystemClock_Config**
20000000 g       .text  00000000 _DATA_BEGIN
20000000 g       .text  00000000 _HEAP
**00000010 g     F .text    00000016 main**
20000000 g       .text  00000000 _BSS_END
00000108 g       .text  00000000 _DATAI_BEGIN
20000000 g       .text  00000000 _BSS_BEGIN
00000108 g       .text  00000000 _DATAI_END
20000000 g       .text  00000000 _DATA_END
Disassembly of section .text:
00000010 <main>:

#define LL_GPIO_MODE_OUTPUT    1

void SystemInit() ;
int main()
{
  10:   b580        push    {r7, lr}
  12:   b082        sub sp, #8
  14:   af00        add r7, sp, #0
    int i = 0;
  16:   2300        movs    r3, #0
  18:   607b        str r3, [r7, #4]
  SystemClock_Config(); 
  **1a: f000 f805   bl  28 <SystemClock_Config>
    for(;;)
        i++;
  1e:   687b        ldr r3, [r7, #4]
  20:   3301        adds    r3, #1**
  22:   607b        str r3, [r7, #4]
  24:   e7fb        b.n 1e <main+0xe>

}
00000028 <SystemClock_Config>:
  *            PLLDIV                         = 3
  *            Flash Latency(WS)              = 1
  * @retval None
  */
void SystemClock_Config(void)
{
  28:   b480        push    {r7}
  2a:   af00        add r7, sp, #0
  SET_BIT(FLASH->ACR, FLASH_ACR_ACC64);
  2c:   4a33        ldr r2, [pc, #204]  ; (fc <SystemClock_Config+0xd4>)
  2e:   4b33        ldr r3, [pc, #204]  ; (fc <SystemClock_Config+0xd4>)
  30:   681b        ldr r3, [r3, #0]
  32:   f043 0304   orr.w   r3, r3, #4
  36:   6013        str r3, [r2, #0]
  MODIFY_REG(FLASH->ACR, FLASH_ACR_LATENCY, LL_FLASH_LATENCY_1);
  38:   4a30        ldr r2, [pc, #192]  ; (fc <SystemClock_Config+0xd4>)
  3a:   4b30        ldr r3, [pc, #192]  ; (fc <SystemClock_Config+0xd4>)
  3c:   681b        ldr r3, [r3, #0]
  3e:   f043 0301   orr.w   r3, r3, #1
  42:   6013        str r3, [r2, #0]*
}

执行循环在PC寄存器中的0x1a,0x1c,0x1e,0x20周围。

halted: PC: 0x0000001a
halted: PC: 0x0000001c
halted: PC: 0x0000001e
halted: PC: 0x00000020
halted: PC: 0x0000001a
halted: PC: 0x0000001c
halted: PC: 0x0000001e
halted: PC: 0x00000020
halted: PC: 0x0000001a
halted: PC: 0x0000001c
halted: PC: 0x0000001e
halted: PC: 0x00000020

它应该在0x1a跳转到0x28(SystemClock_Config)。

2 个答案:

答案 0 :(得分:3)

一个非常简单的完整工作示例:

vectors.s

.thumb

.globl _start
_start:

.word 0x20001000
.word reset

.thumb_func
reset:
    bl centry
done: b done

so.c

unsigned int fun ( unsigned int );
unsigned int centry ( void )
{
    return(fun(5)+1);
}

fun.c

unsigned int fun ( unsigned int x )
{
    return(x+1);
}

flash.ld

MEMORY
{
    rom : ORIGIN = 0x00000000, LENGTH = 0x1000
}

SECTIONS
{
    .text : { *(.text*) } > rom
    .rodata : { *(.rodata*) } > rom
}

构建

arm-none-eabi-as --warn --fatal-warnings -mcpu=cortex-m0 vectors.s -o vectors.o
arm-none-eabi-gcc -Wall -Werror -O2 -nostdlib -nostartfiles -ffreestanding  -mcpu=cortex-m0 -mthumb -c so.c -o so.o
arm-none-eabi-gcc -Wall -Werror -O2 -nostdlib -nostartfiles -ffreestanding  -mcpu=cortex-m0 -mthumb -c fun.c -o fun.o
arm-none-eabi-ld -o so.elf -T flash.ld vectors.o so.o fun.o
arm-none-eabi-objdump -D so.elf > so.list
arm-none-eabi-objcopy so.elf so.bin -O binary

整个计划

00000000 <_start>:
   0:   20001000    andcs   r1, r0, r0
   4:   00000009    andeq   r0, r0, r9

00000008 <reset>:
   8:   f000 f802   bl  10 <centry>

0000000c <done>:
   c:   e7fe        b.n c <done>
    ...

00000010 <centry>:
  10:   b510        push    {r4, lr}
  12:   2005        movs    r0, #5
  14:   f000 f802   bl  1c <fun>
  18:   3001        adds    r0, #1
  1a:   bd10        pop {r4, pc}

0000001c <fun>:
  1c:   3001        adds    r0, #1
  1e:   4770        bx  lr

模拟程序:

read32(0x00000000)=0x20001000
read32(0x00000004)=0x00000009
--- 0x00000008: 0xF000 
--- 0x0000000A: 0xF802 bl 0x0000000F
--- 0x00000010: 0xB510 push {r4,lr}
write32(0x20000FF8,0x00000000)
write32(0x20000FFC,0x0000000D)
--- 0x00000012: 0x2005 movs r0,#0x05
--- 0x00000014: 0xF000 
--- 0x00000016: 0xF802 bl 0x0000001B
--- 0x0000001C: 0x3001 adds r0,#0x01
--- 0x0000001E: 0x4770 bx r14
--- 0x00000018: 0x3001 adds r0,#0x01
--- 0x0000001A: 0xBD10 pop {r4,pc}
read32(0x20000FF8)=0x00000000
read32(0x20000FFC)=0x0000000D
--- 0x0000000C: 0xE7FE b 0x0000000B
--- 0x0000000C: 0xE7FE b 0x0000000B
--- 0x0000000C: 0xE7FE b 0x0000000B
--- 0x0000000C: 0xE7FE b 0x0000000B
--- 0x0000000C: 0xE7FE b 0x0000000B
--- 0x0000000C: 0xE7FE b 0x0000000B
--- 0x0000000C: 0xE7FE b 0x0000000B
--- 0x0000000C: 0xE7FE b 0x0000000B
--- 0x0000000C: 0xE7FE b 0x0000000B
--- 0x0000000C: 0xE7FE b 0x0000000B

确定它是一个有点无用的程序,但它演示了启动和调用函数(函数地址没有显示在堆栈上,当你进行调用时(bl)r14获取返回地址,r15获取地址分支如果你有像centry这样的嵌套函数(C入口点main()不是一个重要的函数名,只要你的bootstrap匹配就可以调用你的入口点)调用fun,然后你需要保留返回地址但是你选择,通常将它保存在堆栈上。只是为了保持堆栈在每个abi的64位边界上对齐而推动r4。

对于您的系统,您通常会将链接描述文件设置为0x08000000(stm32)。

我们遗漏的是你的二进制文件的开头,你可以在内存图像/二进制文件的hexdump中显示main之前的一些字节,包括main的前几条指令吗?

如果裸机程序没有做最简单的启动步骤,那么你要做的第一件事就是检查入口点或向量表取决于架构的二进制文件,看看你是否正确构建它。

在我的例子中这是一个cortex-m所以堆栈指针初始化值(如果你选择使用它)是0x00000000,你可以把任何东西放在那里,然后根据需要简单地写在sp上,你的选择...然后地址0x00000004是复位向量,它是处理复位的代码的地址,lsbit设置为指示拇指模式。

所以0x00000008 | 1 = 0x00000009。

如果你没有

0x2000xxxx 0x00000011

然后你的处理器无法正确启动。我非常习惯使用0x08000000,我不记得0x00000000是否适用于stm,理论上它应该......但取决于你如何加载闪存以及芯片当时的模式/状态。

您可能需要链接0x08000000,如果没有其他更改

,则至少需要链接

0x2000xxxx 0x08000011

作为二进制/内存映像中的前两个字。

修改

请注意,您可以创建一个可以使用向量或引导加载程序输入的单个二进制文件

.thumb

.thumb_func
.global _start
_start:
bl reset
.word _start
reset:
    ldr r0,stacktop
    mov sp,r0
    bl notmain
    b hang
.thumb_func
hang:   b .
.align 
stacktop: .word 0x20001000

在堆栈地址点放置一个分支(井bl以填充空格),然后加载堆栈指针。

或使用分支

.thumb

.thumb_func
.global _start
_start:
b reset
nop
.word _start
reset:
    ldr r0,stacktop
    mov sp,r0
    bl notmain
    b hang
.thumb_func
hang:   b .
.align
stacktop: .word 0x20001000

答案 1 :(得分:1)

您的应用程序缺少中断表。结果,处理器正在读取指令作为中断向量,并重复出错,因为这些指令不能被解释为无效地址。

使用STM32L1xx standard peripheral library中的支持文件生成适当的链接描述文件和中断表。