废弃的分支与常规分支有何不同?

时间:2009-03-02 21:41:34

标签: optimization assembly sparc

特别是对于SPARC Assembly,如何废除分支与常规分支不同?

我一直认为当需要填充分支指令的nop延迟槽时,需要取消分支指令。但是,我不认为我在这方面是正确的,因为你可以在不取消分支的情况下填写nop。

2 个答案:

答案 0 :(得分:6)

如果不采用分支,则无效分支指令会导致延迟时隙中的指令 - 分支后的指令被忽略。

为什么这很重要?因为通常,即使执行分支,也会执行分支之后的指令。这是因为有两个程序计数器,PC和NPC。指示正在执行的指令的PC在NPC被更新到分支指令的目标的同时被更新为NPC,即PC + 4。因此,由于这些事件的时间安排,必须加载下一条指令。如果可以的话,不要只是抛弃那个循环,使用这个循环更有利可图。然后我们将该指令作为循环的一部分。

loop:   someOp                
        someOtherOp
        branch      loop      ;
        delayslotOp           ; will actually be executed, before someOp, after branch

如果我们不能在分支之后使用指令槽,那么我们在那里粘贴一个nop,并且在该循环中什么都不做。

那么为什么然后对废止和非废止分支选项有不同的指示?让我们选择退出循环时会发生什么。如果我们将延迟槽作为循环活动的一部分,我们可能不希望在从循环离开时执行该操作。因此,我们在分支指令的末尾添加“,a”。

This page has some nice examples.

答案 1 :(得分:2)

根据SPARC Architecture Manual (v9)

  

3.2.3控制转移

     

[...]

     

大多数控制转移指令被延迟;也就是说,紧随其后的指令   逻辑序列中的控制转移指令之前被分派   控制转移到目标地址完成。

     

[...]

     

调用延迟控制传输指令后的指令   延迟指令。延迟控制转移指令中的一点   (annul位)可以导致延迟指令被废止(即   如果不采取分支,则无效。

     

6.3.4控制转移指令(CTI)

     

[...]

     

编程注释:annul位增加了a的可能性   编译器可以找到一个有用的指令来填充a之后的延迟槽   分支,从而减少了a执行的指令数量   程序。例如,annul位可用于移动指令   从循环内填充关闭的分支的延迟槽   循环。同样,annul位可用于移动指令   来自“ifthen- else”程序的“else”或“then”分支   阻止在它们之间进行选择的分支的延迟槽。以来   提供了一整套条件,编译器可以安排代码   (可能扭转了条件的意义)这样一条指令   从“else”分支或“then”分支可以移动到   延迟槽。

以下代码显示了两个分支,在第一个分支中始终执行延迟指令,在第二个分支中,如果不执行分支,则取消延迟指令:

cmp   %i3, %i0
ble   %icc, -0x5c
ld    [%l0 - 0x4], %i5  ; executed whether the branch is taken or not

...

cmp   %l1, 0x80
bl,a  %icc, +0x40
ld    [%fp + 0x7c7], %g2    ; annulled if the branch is not taken, executed otherwise