我将clang生成的代码与gcc为arm生成的代码进行比较。
不幸的是,gcc的代码通常没有更少的指令。 我只是好奇 - 是否有可能减少由clang生成的代码? 也许我应该使用一些选项来做到这一点......
请考虑一个非常简单的例子:
> cat test.c
int to_upper(int c)
{
if(c < 'a' || c > 'z') return c;
else return c - ('a' - 'A');
}
> clang -target arm-none-eabi -Oz -c -mthumb -mcpu=cortex-m0 -msoft-float ./test.c -o ./clang_test.o
> /usr/bin/arm-none-eabi-gcc -Os -c -mthumb -mcpu=cortex-m0 -msoft-float ./test.c -o ./gcc_test.o
> /usr/bin/arm-none-eabi-objdump -d ./clang_test.o
./clang_test.o: file format elf32-littlearm
Disassembly of section .text:
00000000 <to_upper>:
0: 4602 mov r2, r0
2: 3a61 subs r2, #97 ; 0x61
4: 4601 mov r1, r0
6: 3920 subs r1, #32
8: 2a19 cmp r2, #25
a: d800 bhi.n e <to_upper+0xe>
c: 4608 mov r0, r1
e: 4770 bx lr
> /usr/bin/arm-none-eabi-objdump -d ./gcc_test.o
./gcc_test.o: file format elf32-littlearm
Disassembly of section .text:
00000000 <to_upper>:
0: 1c03 adds r3, r0, #0
2: 3b61 subs r3, #97 ; 0x61
4: 2b19 cmp r3, #25
6: d800 bhi.n a <to_upper+0xa>
8: 3820 subs r0, #32
a: 4770 bx lr
为什么这么简单的代码会有这么大的差异? 在这种情况下clang会产生更少的代码吗?至少作为gcc?
注意:如果我们将cpu更改为-mcpu = cortex-a5(其他选项保持不变),则clang ang gcc产生 完全相同的代码:
00000000 <to_upper>:
0: f1a0 0361 sub.w r3, r0, #97 ; 0x61
4: 2b19 cmp r3, #25
6: bf98 it ls
8: 3820 subls r0, #32
a: 4770 bx lr
操作系统:Ubuntu 14.04.3
clang version 3.7.1(tags / RELEASE_371 / final) 目标:x86_64-unknown-linux-gnu 线程模型:posix
arm-none-eabi-gcc(4.8.2-14ubuntu1 + 6)4.8.2
答案 0 :(得分:1)
不,在这种情况下,clang无法生成更少的代码。还有许多其他人。
历史上,LLVM中实现的代码大小优化很少。在优化代码大小时,GCC通常会明显优于LLVM。
Here presentation,在代码大小优化方面仔细研究了比较GCC和Clang。