我在Cortex-R4中运行的C代码中进行优化。 首先,当我在条件检查中指出“__builtin_expect”时,我没有看到汇编代码输出有任何变化。 看起来编译器会产生不必要的跳转。
我的C代码:
bit ++; (Likely)
if(__builtin_expect(bit >= 32),0)
{
bit -=32; // unlikely code
xxxxxx; // unlikely code
xxxxxx; // unlikely code
xxxxxx; // unlikely code
}
bit = bit*2 // something (Likely)
return bit;
----生成的ASM代码-------- (bit => r0)
ADD r2,r2,#1
CMP r0,#0x20
BCC NoDecrement
SUB r0,r0,#0x20
XXXXXXXXX
XXXXXXXXX
XXXXXXXXX
NoDecrement LSL r0,r0,#1
BX lr
----我期望的ASM代码--------
ADD r2,r2,#1
CMP r0,#0x20
BHE Decrement
JumbBack LSL r0,r0,#1
BX lr
Decrement SUB r0,r0,#0x20
XXXXXXXXX
XXXXXXXXX
XXXXXXXXX
B JumbBack
假设这段C代码在循环中运行,那么每次都必须跳转(因为if条件只传递一次)。 是否有任何其他编译器设置实际上,按预期生成代码.. ??
答案 0 :(得分:6)
您写道:
if(__builtin_expect(bit >= 32),0)
{
...
}
大括号内的代码将从不执行,因为它被if(foo,0)
包围,对于if(0)
的任何值都相当于foo
,不无论你想要使用什么内置物。如果使用-O2
启用优化,您将看到编译器完全删除了死代码,而不是仅仅跳过它。我想你可能打算写
if (__builtin_expect(bit >= 32, 0)) {
bit -= 32;
}
如果我这样做,我会得到我期望的前向分支(clang -O1
或更高)。
extern void something();
int foo(int bit)
{
++bit;
if (__builtin_expect(bit >= 32, 0)) {
bit -= 32; // "Decrement"
something();
}
bit = bit*2;
something();
return bit;
}
以下是clang -arch armv7 -O2 -S
的代码:
_foo:
@ BB#0:
push {r4, r7, lr}
adds r4, r0, #1
add r7, sp, #4
cmp r4, #32
bge LBB0_2 // a forward branch for the unlikely case
LBB0_1:
lsls r4, r4, #1
blx _something
mov r0, r4
pop {r4, r7, pc}
LBB0_2: // "Decrement"
sub.w r4, r0, #31
blx _something
b LBB0_1