什么是“ld -Ttext”选项呢?

时间:2016-01-05 22:41:00

标签: linker kernel ld

我正在关注this half-completed tutorial开发一个简单的操作系统。一步(第50页)是使用$ld -o kernel.bin -Ttext 0x1000 kernel.o --oformat binary编译一个简单的内核。但是我真的不明白-Ttext选项的作用是什么。

为了使问题具体化,为什么在以下实验中是kernel_1000.bin&的md5s。 kernel.bin等于kernel_1001.bin& kernel_1009.bin相等,kernel_1007.bin& kernel_1017.bin相等,而所有其他对不相等?

我的实验

我尝试使用不同的-Ttext编译几个不同的内核,如下面的Makefile所示:

...
kernel.o: kernel.c
    gcc -ffreestanding -c kernel.c

kernel.bin: kernel.o
    ld -o $@ kernel.o --oformat binary

kernel_1000.bin: kernel.o
    ld -o $@ -Ttext 0x1000 kernel.o --oformat binary

kernel_1001.bin: kernel.o
    ld -o $@ -Ttext 0x1001 kernel.o --oformat binary
...

然后我检查了他们的md5:

$ ls *.bin | xargs md5sum
d9248440a2c816e41527686cdb5118e4  kernel_1000.bin
65db5ab465301da1176b523dec387a40  kernel_1001.bin
819a5638827494a4556b7a96ee6e14b2  kernel_1007.bin
d9248440a2c816e41527686cdb5118e4  kernel_1008.bin
65db5ab465301da1176b523dec387a40  kernel_1009.bin
216b24060abce034911642acfa880403  kernel_1015.bin
e92901b1d12d316c564ba7916abca20c  kernel_1016.bin
819a5638827494a4556b7a96ee6e14b2  kernel_1017.bin
d9248440a2c816e41527686cdb5118e4  kernel.bin

kernel.c

void main() {
  char* video_memory = (char*) 0xb8000;
  *video_memory = 'X';
}

开发环境

$ gcc -v
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/4.9/lto-wrapper
Target: x86_64-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Debian 4.9.2-10' --with-bugurl=file:///usr/share/doc/gcc-4.9/README.Bugs --enable-languages=c,c++,java,go,d,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-4.9 --enable-shared --enable-linker-build-id --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --with-gxx-include-dir=/usr/include/c++/4.9 --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --enable-gnu-unique-object --disable-vtable-verify --enable-plugin --with-system-zlib --disable-browser-plugin --enable-java-awt=gtk --enable-gtk-cairo --with-java-home=/usr/lib/jvm/java-1.5.0-gcj-4.9-amd64/jre --enable-java-home --with-jvm-root-dir=/usr/lib/jvm/java-1.5.0-gcj-4.9-amd64 --with-jvm-jar-dir=/usr/lib/jvm-exports/java-1.5.0-gcj-4.9-amd64 --with-arch-directory=amd64 --with-ecj-jar=/usr/share/java/eclipse-ecj.jar --enable-objc-gc --enable-multiarch --with-arch-32=i586 --with-abi=m64 --with-multilib-list=m32,m64,mx32 --enable-multilib --with-tune=generic --enable-checking=release --build=x86_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu
Thread model: posix
gcc version 4.9.2 (Debian 4.9.2-10) 
$ uname -a
Linux localhost 3.16.0-4-amd64 #1 SMP Debian 3.16.7-ckt20-1+deb8u1 (2015-12-14) x86_64 GNU/Linux

1 个答案:

答案 0 :(得分:6)

-Ttext选项会将程序的.text部分放在给定的地址中。例如,如果您要编译此汇编代码:

section .text
global _start
_start:
    mov al, '!'
    jmp l
l:  mov ah, 0x0e
    mov bh, 0x00
    mov bl, 0x07

    int 0x10
    jmp $

times 510-($-$$) db 0

db 0x55
db 0xaa

使用:

nasm -f elf64 -o test.o test.S
ld -o test test.o

并会使用objdump进行查看,您会看到它是通过默认地址链接的,0x0000000000400000附近的x86_64

~$ objdump -D test

test:     file format elf64-x86-64


Disassembly of section .text:

0000000000400080 <_start>:
  400080:   b0 21                   mov    $0x21,%al
  400082:   eb 00                   jmp    400084 <l>

0000000000400084 <l>:
  400084:   b4 0e                   mov    $0xe,%ah
  ...
  ...
  ...

程序中的所有地址(至少在.text部分中)都与此地址相关。如果您要添加-Ttext 1000选项,您会看到:

〜$ objdump -D test

test:     file format elf64-x86-64


Disassembly of section .text:

0000000000001000 <_start>:
    1000:   b0 21                   mov    $0x21,%al
    1002:   eb 00                   jmp    1004 <l>

0000000000001004 <l>:
    1004:   b4 0e                   mov    $0xe,%ah

您的程序将链接到0x1000地址开始,所有地址(包括jmp等)将相对于0x1000来。

这对两件事很重要。简而言之,当操作系统内核加载程序时,它会加载elf格式或其他二进制格式的可执行文件,并读取.text部分的开始位置。在我们的示例中,您可以根据需要链接kernel.bin,因为没有加载器作为操作系统内核,并且您掌握了所有内存空间。

因此,如果您要将kernel.bin链接到0x1000,那么您将知道代码开始工作的位置(当然,如果它实际上会在内存中加载)并且您知道代码的基地址,您可以获取其中的所有地址,例如my_label_inside_program - _start