我正在关注this half-completed tutorial开发一个简单的操作系统。一步(第50页)是使用$ld -o kernel.bin -Ttext 0x1000 kernel.o --oformat binary
编译一个简单的内核。但是我真的不明白-Ttext
选项的作用是什么。
为了使问题具体化,为什么在以下实验中是kernel_1000.bin
&的md5s。 kernel.bin
等于kernel_1001.bin
& kernel_1009.bin
相等,kernel_1007.bin
& kernel_1017.bin
相等,而所有其他对不相等?
我尝试使用不同的-Ttext
编译几个不同的内核,如下面的Makefile
所示:
...
kernel.o: kernel.c
gcc -ffreestanding -c kernel.c
kernel.bin: kernel.o
ld -o $@ kernel.o --oformat binary
kernel_1000.bin: kernel.o
ld -o $@ -Ttext 0x1000 kernel.o --oformat binary
kernel_1001.bin: kernel.o
ld -o $@ -Ttext 0x1001 kernel.o --oformat binary
...
然后我检查了他们的md5:
$ ls *.bin | xargs md5sum
d9248440a2c816e41527686cdb5118e4 kernel_1000.bin
65db5ab465301da1176b523dec387a40 kernel_1001.bin
819a5638827494a4556b7a96ee6e14b2 kernel_1007.bin
d9248440a2c816e41527686cdb5118e4 kernel_1008.bin
65db5ab465301da1176b523dec387a40 kernel_1009.bin
216b24060abce034911642acfa880403 kernel_1015.bin
e92901b1d12d316c564ba7916abca20c kernel_1016.bin
819a5638827494a4556b7a96ee6e14b2 kernel_1017.bin
d9248440a2c816e41527686cdb5118e4 kernel.bin
void main() {
char* video_memory = (char*) 0xb8000;
*video_memory = 'X';
}
$ gcc -v
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/4.9/lto-wrapper
Target: x86_64-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Debian 4.9.2-10' --with-bugurl=file:///usr/share/doc/gcc-4.9/README.Bugs --enable-languages=c,c++,java,go,d,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-4.9 --enable-shared --enable-linker-build-id --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --with-gxx-include-dir=/usr/include/c++/4.9 --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --enable-gnu-unique-object --disable-vtable-verify --enable-plugin --with-system-zlib --disable-browser-plugin --enable-java-awt=gtk --enable-gtk-cairo --with-java-home=/usr/lib/jvm/java-1.5.0-gcj-4.9-amd64/jre --enable-java-home --with-jvm-root-dir=/usr/lib/jvm/java-1.5.0-gcj-4.9-amd64 --with-jvm-jar-dir=/usr/lib/jvm-exports/java-1.5.0-gcj-4.9-amd64 --with-arch-directory=amd64 --with-ecj-jar=/usr/share/java/eclipse-ecj.jar --enable-objc-gc --enable-multiarch --with-arch-32=i586 --with-abi=m64 --with-multilib-list=m32,m64,mx32 --enable-multilib --with-tune=generic --enable-checking=release --build=x86_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu
Thread model: posix
gcc version 4.9.2 (Debian 4.9.2-10)
$ uname -a
Linux localhost 3.16.0-4-amd64 #1 SMP Debian 3.16.7-ckt20-1+deb8u1 (2015-12-14) x86_64 GNU/Linux
答案 0 :(得分:6)
-Ttext
选项会将程序的.text部分放在给定的地址中。例如,如果您要编译此汇编代码:
section .text
global _start
_start:
mov al, '!'
jmp l
l: mov ah, 0x0e
mov bh, 0x00
mov bl, 0x07
int 0x10
jmp $
times 510-($-$$) db 0
db 0x55
db 0xaa
使用:
nasm -f elf64 -o test.o test.S
ld -o test test.o
并会使用objdump
进行查看,您会看到它是通过默认地址链接的,0x0000000000400000
附近的x86_64
:
~$ objdump -D test
test: file format elf64-x86-64
Disassembly of section .text:
0000000000400080 <_start>:
400080: b0 21 mov $0x21,%al
400082: eb 00 jmp 400084 <l>
0000000000400084 <l>:
400084: b4 0e mov $0xe,%ah
...
...
...
程序中的所有地址(至少在.text
部分中)都与此地址相关。如果您要添加-Ttext 1000
选项,您会看到:
〜$ objdump -D test
test: file format elf64-x86-64
Disassembly of section .text:
0000000000001000 <_start>:
1000: b0 21 mov $0x21,%al
1002: eb 00 jmp 1004 <l>
0000000000001004 <l>:
1004: b4 0e mov $0xe,%ah
您的程序将链接到0x1000
地址开始,所有地址(包括jmp等)将相对于0x1000
来。
这对两件事很重要。简而言之,当操作系统内核加载程序时,它会加载elf格式或其他二进制格式的可执行文件,并读取.text
部分的开始位置。在我们的示例中,您可以根据需要链接kernel.bin
,因为没有加载器作为操作系统内核,并且您掌握了所有内存空间。
因此,如果您要将kernel.bin
链接到0x1000
,那么您将知道代码开始工作的位置(当然,如果它实际上会在内存中加载)并且您知道代码的基地址,您可以获取其中的所有地址,例如my_label_inside_program - _start
。