我的问题非常基本。我正在使用汇编程序制作我的第一个裸机程序。该架构是ARMv7-M,我正在使用GNU,我正在用UAL编写。
我在.bss(或.data,无关紧要)中有一个变量声明如下:
.lcomm a_variable, 4
然后我想在程序的某处读取它的值。为此,我首先将其地址加载到寄存器中,然后将变量本身的值加载到另一个寄存器中:
adr r0, a_variable
ldr r1, [r0, #0]
到目前为止一切顺利。编译对象包含我的 a_variable 符号:
00000000 b a_variable
生成的指令如下所示:
0: f2af 0004 subw r0, pc, #4
4: 6801 ldr r1, [r0, #0]
当我想将对象链接到结果图像时,问题开始。 ld将 a_variable 符号重新定位到新地址的最终.bss部分:
20001074 b a_variable
但是最终代码保持不变,程序确实尝试从地址0x0读取 a_variable ,但不是从0x20001074读取。
我希望ld以某种方式替换新地址,因为当你链接由GCC编译的对象时它似乎会这样做。我的意思是如果我写一段C代码做类似的事情:
static int a_variable;
void foo(void)
{
a_variable = 5;
}
...然后我在目标文件中得到以下说明:
0: f240 0300 movw r3, #0
4: f2c0 0300 movt r3, #0
8: 2005 movs r0, #5
a: 6018 str r0, [r3, #0]
...但最终图片看起来像这样:
800c: f242 338c movw r3, #9100 ; 0x238c
8010: f2c0 0301 movt r3, #1
8014: 2005 movs r0, #5
8016: 6018 str r0, [r3, #0]
所以ld似乎已经替换了左边的占位符的实际地址。
我的问题是为什么在手写汇编代码的情况下这不起作用?我错过了什么?
答案 0 :(得分:2)
ADR指令仅在与同一部分和源文件中定义的附近符号(Thumb2模式下为+/- 4095)一起使用时才有效。 GNU汇编器应该在引用其他部分中的符号时出错。在ARM模式下,您的代码会生成Error: symbol .bss is in a different section
错误,但显然GAS在Thumb模式下处理ADR指令的方式存在一个错误,导致它无声地接受它。
相反,您可以使用LDR或MOVW / MOVT指令将任意32位常量(包括地址)加载到寄存器中。 LDR指令将地址放入常量池并从那里加载,而MOVW / MOVT指令分两步形成常量,就像编译器一样。前一条指令只需要6个字节(2个用于指令,4个用于常量),后两个指令占用8个字节。例如:
.syntax unified
.arch armv7-m
.code 16
.bss
.lcomm a_variable, 4
.text
ldr r1, =a_variable
movw r2, #:lower16:a_variable
movt r2, #:upper16:a_variable
在组装,链接和拆卸时,会给出:
$ arm-linux-gnueabi-as -o test.o test.s
$ arm-linux-gnueabi-ld -Tbss=f0000000 test.o
arm-linux-gnueabi-ld: warning: cannot find entry symbol _start; defaulting to 0000000000010074
$ arm-linux-gnueabi-objdump -d a.out
...
00010074 <.text>:
10074: 4902 ldr r1, [pc, #8] ; (10080 <__bss_start-0x10f80>)
10076: f240 0200 movw r2, #0
1007a: f2cf 0200 movt r2, #61440 ; 0xf000
1007e: 0000 movs r0, r0
10080: f0000000 .word 0xf0000000