在Linux内核中使用浮点

时间:2012-12-14 21:15:00

标签: linux floating-point linux-kernel

我正在阅读Robert Love的“Linux内核开发”,我看到了以下段落:

  

否(轻松)使用浮点

     

当用户空间进程使用浮点指令时,内核管理从整数到浮点模式的转换。内核在使用浮点指令时必须做的事情因架构而异,但内核通常会捕获一个陷阱,然后启动从整数到浮点模式的转换。

     

与用户空间不同,内核不具备对浮点的无缝支持,因为它无法轻易捕获自身。在内核中使用浮点需要手动保存和恢复浮点寄存器以及其他可能的杂务。简短的回答是:不要这样做!除了极少数情况外,内核中没有浮点运算。

我从未听说过这些“整数”和“浮点”模式。究竟是什么,为什么需要它们?这种区别是否存在于主流硬件架构(例如x86)上,还是特定于某些更奇特的环境?从进程和内核的角度来看,从整数模式到浮点模式的转换到底需要什么?

2 个答案:

答案 0 :(得分:73)

因为...

  • 许多程序不使用浮点或不在任何给定的时间片上使用它;
  • 保存FPU寄存器和其他FPU状态需要时间; 因此

...操作系统内核可能只是关闭FPU。 Presto,没有保存和恢复的状态,因此更快的上下文切换。 (这就是模式的意思,它只是意味着FPU已启用。)

如果程序尝试FPU操作,程序将陷入内核,内核将打开FPU,恢复可能已存在的任何已保存状态,然后返回重新执行FPU操作。

在上下文切换时,它知道实际经历状态保存逻辑。 (然后它可能会再次关闭FPU。)

顺便说一句,我相信本书对内核(而不仅仅是Linux)避免FPU操作的原因的解释是......不完全准确。 1

内核可以陷入自身,并为许多事情做到这一点。 (定时器,页面错误,设备中断,其他。)真正的原因是内核并不特别需要 FPU操作,并且还需要在没有FPU的架构上运行。因此,它通过不执行其他软件解决方案的操作,简单地避免了管理自己的FPU上下文所需的复杂性和运行时间。

有趣的是,如果内核想要使用FP ,那么FPU状态必须经常保存的频率。 。 。每个系统调用,每个中断,内核线程之间的每次切换。即使偶尔需要内核FP, 2 ,在软件中执行它可能会更快。

<小时/> 那就是,死错了。
2.在一些情况下我知道内核软件包含浮点算术实现。有些架构在硬件中实现了传统的FPU操作,但是给软件留下了一些复杂的IEEE FP操作。 (想想:非正规算术。)当一些奇怪的IEEE角落情况发生时,它们陷入软件,其中包含可以捕获的操作的迂腐正确的仿真。

答案 1 :(得分:15)

对于某些内核设计,当“内核”或“系统”任务被任务切换时,不会保存浮点寄存器。 (这是因为FP寄存器很大并且需要时间和空间来保存。)因此,如果您尝试使用FP,则值将随机变为“poof”。

此外,一些硬件浮点方案依靠内核通过陷阱处理“奇怪”情况(例如,零分割),并且所需的陷阱机制可能处于比内核任务更高的“级别”。目前正在运行。

由于这些原因(以及其他一些原因),当您在任务中第一次使用FP指令时,某些硬件FP方案将陷入陷阱。如果你被允许使用FP,那么在任务中打开一个浮点旗,如果没有,你就会被行刑队射杀。