据我所知,Return Stack Buffer仅支持4到16个条目(来自wiki:http://en.wikipedia.org/wiki/Branch_predictor#Prediction_of_function_returns),而不是键值对(基于ret指令位置的索引)。这是真的吗? 上下文切换发生时RSB会发生什么?
假设我们进入了50个函数,这些函数在返回堆栈缓冲区长度为16的CPU中没有返回,之后会发生什么?这是否意味着所有预测都失败了?你能说明一下吗?这种情况在递归函数调用中是否相同?
谢谢!
答案 0 :(得分:1)
BPU 可以包含自己的 RAS 预测器,当它预测 BTB 中的调用类型时,它会将假定的调用 NLIP(以下指令的 IP)推送到 RAS 堆栈上。它在 BTB 中预测的下一个返回将使用 RAS 的顶部作为预测地址(就像它预测常规间接分支时,ITA 中的并行命中将超过 BTB 中的目标地址)。
BAC 将在解码时通过将每个调用指令的 NLIP 推送到其自己的 RSB 来验证/覆盖这些返回目标预测,下一个返回地址的预测将与该地址进行比较。如果不正确,BAC 将发出 BAclear 并将管道开始处的下一个 IP 逻辑重新引导到正确的返回地址(如果 RSB 损坏,结果可能是错误的)。它可能会用 BAC RSB 状态覆盖 RAS 预测器堆栈。
在一个实现中,BAC 为 TOS 指针提供它验证的每个分支预测,以及失败地址。一旦执行分支并且知道真实结果,如果发生错误预测,则恢复RSB TOS。我认为更有效的是在退休时使用架构 RSB,在管道刷新/错误预测时将其复制到 BAC RSB 和 RAS 预测器中。这可以防止恢复到损坏的 RSB。
RAS 预测器很可能是一个循环堆栈,它可能有也可能没有上溢和下溢检查和保证,具体取决于实现。当堆栈已满时,新的预测可能会覆盖最旧的预测,以便它始终是最新的(而不是阻止它在已满时被添加,这意味着保留一个计数器,以了解有多少调用/返回它无法进行预测为了)。至于下溢,它可能拒绝进行预测,而是使用 ITA 进行预测。如果 RSB 下溢,它可能不会覆盖 RAS 预测器所做的预测。
上下文切换的硬件中断会导致在执行宏操作的最后一个 uop 时清除管道。 RSB 很可能恢复到架构状态以在中断后继续。预测器 RAS / BAC RSB 可能会在微代码中刷新,如果它被损坏,它最终会自行恢复。