我正在尝试编写一个bootloader。我想编译一些 C 代码,以便引导加载程序可以将其加载到内存中并跳转到那里。
我有两个问题:
答案 0 :(得分:5)
您可以使用链接描述文件使用gcc链接器创建纯二进制文件。 关键是OUTPUT_FORMAT(二进制)指令:
//========================================
FILE: linker.ld
//========================================
OUTPUT_FORMAT(binary)
SECTIONS {
.text : { *(.text) }
.data : { *(.data) }
.bss : { *(.bss) }
}
//========================================
我在makefile中调用了链接器,如下所示(而linker.ld是链接描述文件):
//========================================
ld -T linker.ld loaderEntry.o loaderMain.o -o EOSLOAD.BIN -L$(lib) -lsys16
//========================================
我用
编译了目标代码//========================================
gcc -nostdinc -nostdlib -ffreestanding -c <code files> -o theObjectCode.o
//========================================
为了摆脱不能在16位模式下工作的标准库。
用于握手MBR加载器和引导加载程序我使用了以下loaderMain.Scc汇编代码(loaderMain.o必须是传递给链接器的第一个文件,位于地址偏移量0x0000,如上所示)。 我使用-code16gcc指令来生成16位代码。 但是,生成的代码可能不适用于旧的x86机器,因为我使用不兼容 代码说明(%esp,$ ebp,leave等)仅适用于较新型号。
//========================================
FILE: loaderEntry.S
//========================================
.text
.code16gcc
// the entry point at 0x9000:0x0000 // this is where I did a far call to by the MBR
.globl loaderMain // loader C entry function name declaration
push %cs // initialize data segments with same value as code segment
pop %ax // (I managed only tiny model so far ...)
movw %ax, %ds
movw %ax, %es
movw %ax, %fs
movw %ax, %gs
movw %ax, %ss // initialize stack segment with same value as code segment
movl $0xffff, %esp // initialize stack pointers with 0xffff (usage of extended (dword) offsets does not work, so we're stuck in tiny model)
movl %esp, %ebp
call loaderMain // call C entry function
cli // halt the machine for the case the main function dares to return
hlt
//========================================
汇编代码调用已在C语言文件loaderMain.c中定义的符号。 为了生成16位模式兼容代码,您必须在使用的每个C文件中的第一行代码之前声明16位指令集的使用。这只能通过内联汇编指令AFAIK来完成:
asm(".code16gcc\n"); // use 16bit real mode code set
/* ... some C code .. */
// ... and here is the C entry code ... //
void loaderMain() {
uint cmdlen = 0;
bool terminate = false;
print(NL);
print(NL);
print("*** EOS LOADER has taken over control. ***\r\n\r\n");
print("Enter commands on the command line below.\r\n");
print("Command are executed by pressing the <ENTER> key.\r\n");
print("The command \'help\' shows a list of all EOS LOADER commands.\r\n");
print("HAVE FUN!\r\n");
print(NL);
while (!terminate) {
print("EOS:>");
cmdlen = readLine();
buffer[cmdlen] = '\0';
print(NL);
terminate = command();
}
shutdown();
}
到目前为止,我只能编写普通的C代码 - 到目前为止,我没有成功使用C ++代码, 我只设法生产微小的内存模型(意思是CS,SS,DS和ES都是一样的)。 gcc仅使用偏移量作为指针地址,因此如果没有额外的汇编代码,似乎很难克服timny内存模型问题。 (虽然我听说有人在gcc中解决了这个问题)
调用约定是在堆栈上首先推送最后一个参数,似乎所有值都是dword对齐的。可以在.code16gcc C代码中调用的汇编代码示例发布如下:
//======================
.text
.code16gcc
.globl kbdread // declares a global symbol so that the function can be called from C
.type kbdread, @function // declares the symbol as a function
kbdread: // the entry point label which has to the same as the symbol
// this is the conventional stack frame for function entry
pushl %ebp
movl %esp, %ebp
// memory space for local variables would be allocated by decrementing the stack pointer accordingly
// the parameter arguments are being addressed by the base pointer which points to the same address while bein within the function
pushw %ds // I'm paranoid, I know...
pushw %es
pushw %fs
pushl %eax
pushl %ebx
pushl %ecx
pushl %edx
pushl %esi
pushl %edi
xorl %eax, %eax // calls the keyboard interrupt in order to read char code and scan code
int $0x16
xorl %edi, %edi
movl 8(%ebp), %edi // moves the pointer to the memory location in which the char code will be stored into EDI
movb %al, (%edi) // moves the char code from AL to the memory location to which EDI points
xorl %edi, %edi // paranoid again (but who knows how well the bios handles extended registers??)..
movl 12(%ebp), %edi // moves the pointer to the memory location in which the scan code will be stored into EDI
movb %ah, (%edi) // moves the scan code from AH to the memory location to which EDI points
popl %edi // restoring the values from stack..
popl %esi
popl %edx
popl %ecx
popl %ebx
popl %eax
popw %fs
popw %es
popw %ds
leave // .. and the conventional end frame for functions.
ret // be aware that you are responsible to restore the stack when you have declared local variables on the stack ponter.
// the leave instruction is a convenience method to do that. but it is part of not early X86 instruction set (as well as extended registers)
// so be careful which instruftion you actually use if you have to stay compatible with older computer models.
//=====================
btw函数的C头声明如下:
//=====================
void kbdread(char* pc, (unsigned char)* psc);
//=====================
希望这在某种程度上有所帮助。欢呼声。
答案 1 :(得分:4)
根据您之前的问题,我假设您要为现代x86机器(即386或更高版本)创建引导加载程序。
在实模式下,默认操作数和地址大小为16位。不幸的是,GCC无法生成16位x86汇编代码。但是,通过将指令.code16gcc
放在每个文件的顶部,您可以告诉as
使用将覆盖地址和操作数大小的指令前缀。这些前缀在 Intel 64和IA-32架构软件开发人员手册第1卷的3.3.5节中有更详细的描述。
有关.code16gcc
的更多信息,请here。请注意,本手册来自2003年,.code16gcc
不再具有实验性,或者至少足够稳定,无法供Linux使用。
由于gcc不知道汇编代码的作用,调用约定将保持不变。 Here是一个可用于生成引导加载程序的ld脚本。
答案 2 :(得分:2)
8086 IS x86。 8088/86使用了不同的型号,小型,中型,大型,巨型。根据模型,您可以/将在堆栈上获得差异。一个巨大/大的返回地址是段和偏移量,其中一个小的返回地址就是偏移量(例如,导致整个堆栈设置发生变化)。卡尔已经提到了堆栈的宽度。
编译和反汇编一些简单的例子,这应该是显而易见的。如果gcc没有做非平坦目标,那么也许尝试djgpp。或watcom或borland(免费)。
答案 3 :(得分:1)
首先,8086是x86。
其次,调用约定特定于您正在使用的编译器及其可以更改它的任何功能(例如,您通常可以指定诸如cdecl
,stdcall
,{{1}之类的内容等等)。你使用什么编译器?
第三,gcc不会将代码编译为16位x86指令。
正如@dwelch建议的那样,使用Open Watcom C / C ++或古老的Borland / Turbo C / C ++,它们是免费的,可以编译16位代码。
答案 4 :(得分:0)
objcopy
从链接对象中获取原始二进制数据。您可能也想查看linker scripts。