GNU as:如何将.bss / .data符号加载到寄存器中?

时间:2015-07-29 12:53:03

标签: assembly gnu armv7 binutils

我的问题非常基本。我正在使用汇编程序制作我的第一个裸机程序。该架构是ARMv7-M,我正在使用GNU,我正在用UAL编写。

我在.bss(或.data,无关紧要)中有一个变量声明如下:

.lcomm a_variable, 4

然后我想在程序的某处读取它的值。为此,我首先将其地址加载到寄存器中,然后将变量本身的值加载到另一个寄存器中:

adr     r0, a_variable
ldr     r1, [r0, #0]

到目前为止一切顺利。编译对象包含我的 a_variable 符号:

00000000 b a_variable

生成的指令如下所示:

0:  f2af 0004   subw    r0, pc, #4
4:  6801        ldr     r1, [r0, #0]
当我想将对象链接到结果图像时,

问题开始。 ld将 a_variable 符号重新定位到新地址的最终.bss部分:

20001074 b a_variable

但是最终代码保持不变,程序确实尝试从地址0x0读取 a_variable ,但不是从0x20001074读取。

我希望ld以某种方式替换新地址,因为当你链接由GCC编译的对象时它似乎会这样做。我的意思是如果我写一段C代码做类似的事情:

static int a_variable;
void foo(void)
{
    a_variable = 5;
}

...然后我在目标文件中得到以下说明:

0:  f240 0300   movw    r3, #0
4:  f2c0 0300   movt    r3, #0
8:  2005        movs    r0, #5
a:  6018        str r0, [r3, #0]

...但最终图片看起来像这样:

800c:       f242 338c       movw    r3, #9100       ; 0x238c
8010:       f2c0 0301       movt    r3, #1
8014:       2005            movs    r0, #5
8016:       6018            str     r0, [r3, #0]

所以ld似乎已经替换了左边的占位符的实际地址。

我的问题是为什么在手写汇编代码的情况下这不起作用?我错过了什么?

1 个答案:

答案 0 :(得分:2)

ADR指令仅在与同一部分和源文件中定义的附近符号(Thumb2模式下为+/- 4095)一起使用时才有效。 GNU汇编器应该在引用其他部分中的符号时出错。在ARM模式下,您的代码会生成Error: symbol .bss is in a different section错误,但显然GAS在Thumb模式下处理ADR指令的方式存在一个错误,导致它无声地接受它。

相反,您可以使用LDR或MOVW / MOVT指令将任意32位常量(包括地址)加载到寄存器中。 LDR指令将地址放入常量池并从那里加载,而MOVW / MOVT指令分两步形成常量,就像编译器一样。前一条指令只需要6个字节(2个用于指令,4个用于常量),后两个指令占用8个字节。例如:

    .syntax unified
    .arch armv7-m
    .code 16

    .bss
    .lcomm a_variable, 4

    .text

    ldr     r1, =a_variable
    movw    r2, #:lower16:a_variable
    movt    r2, #:upper16:a_variable

在组装,链接和拆卸时,会给出:

$ arm-linux-gnueabi-as -o test.o test.s
$ arm-linux-gnueabi-ld -Tbss=f0000000 test.o
arm-linux-gnueabi-ld: warning: cannot find entry symbol _start; defaulting to 0000000000010074
$ arm-linux-gnueabi-objdump -d a.out
...    
00010074 <.text>:
   10074:       4902            ldr     r1, [pc, #8]    ; (10080 <__bss_start-0x10f80>)
   10076:       f240 0200       movw    r2, #0
   1007a:       f2cf 0200       movt    r2, #61440      ; 0xf000
   1007e:       0000            movs    r0, r0
   10080:       f0000000        .word   0xf0000000