自从我几个星期前开始使用以来,我已经看到了这两个并行短语,需要有C编译器知识的人告诉我哪些能带来更好的代码。
版本1:
char s[]="aString",*sp=&s,c;
while(c=*sp++){
operation(c);
}
版本2:
char s[]="aString",*sp=&s;
for(;*sp;sp++){
operation(*sp);
}
好吧,我知道版本2涉及一些重复差异,因此版本1总是比版本2好吗?如果没有,有什么典型的例外?
答案 0 :(得分:3)
我希望在任何合理的优化级别都能完全相同 - 你试过吗?
编辑:
我想确认一下,所以我尝试了。这是我的示例程序(我也修复了指针不匹配错误):
void operation(char);
void f1(void)
{
char s[]="aString",*sp=s,c;
while(c=*sp++) {
operation(c);
}
}
void f2(void)
{
char s[]="aString",*sp=s;
for(;*sp;sp++) {
operation(*sp);
}
}
在Mac上的-O3
处使用clang编译,这是目标文件:
example.o:
(__TEXT,__text) section
_f1:
0000000000000000 pushq %rbp
0000000000000001 movq %rsp,%rbp
0000000000000004 pushq %rbx
0000000000000005 pushq %rax
0000000000000006 movq $0x00676e6972745361,%rax
0000000000000010 movq %rax,0xf0(%rbp)
0000000000000014 movb $0x61,%al
0000000000000016 leaq 0xf1(%rbp),%rbx
000000000000001a nopw _f1(%rax,%rax)
0000000000000020 movsbl %al,%edi
0000000000000023 callq _operation
0000000000000028 movb (%rbx),%al
000000000000002a incq %rbx
000000000000002d testb %al,%al
000000000000002f jne 0x00000020
0000000000000031 addq $0x08,%rsp
0000000000000035 popq %rbx
0000000000000036 popq %rbp
0000000000000037 ret
0000000000000038 nopl _f1(%rax,%rax)
_f2:
0000000000000040 pushq %rbp
0000000000000041 movq %rsp,%rbp
0000000000000044 pushq %rbx
0000000000000045 pushq %rax
0000000000000046 movq $0x00676e6972745361,%rax
0000000000000050 movq %rax,0xf0(%rbp)
0000000000000054 movb $0x61,%al
0000000000000056 leaq 0xf1(%rbp),%rbx
000000000000005a nopw _f1(%rax,%rax)
0000000000000060 movsbl %al,%edi
0000000000000063 callq _operation
0000000000000068 movb (%rbx),%al
000000000000006a incq %rbx
000000000000006d testb %al,%al
000000000000006f jne 0x00000060
0000000000000071 addq $0x08,%rsp
0000000000000075 popq %rbx
0000000000000076 popq %rbp
0000000000000077 ret
如你所见,字面意思相同。
答案 1 :(得分:1)
现在,任何好的编译器都会编译这些循环几乎完全相同。
如果输入更短或使代码更易于阅读,您可能希望使用临时变量c
。但是不要为了某种想象的性能优势而做这样的事情。
答案 2 :(得分:0)
任何有价值的优化编译器都会将它们优化为相同的汇编代码。除非您使用剖析器测量了这一点,并确定它是一个瓶颈,否则不要试图过早地优化它。
在某些情况下,如果值被多次访问,编译器将无法确定基础字符串是否不会发生变化,在这种情况下,它必须执行内存访问不止一次。在这些情况下,在变量中缓存字符会有一点点优势,但即使这样,优势也会非常小。像这样:
for( ; *sp; sp++) {
operation1(*sp);
some_function(sp);
operation2(*sp);
}
在这种情况下,编译器可能不知道some_function
是否修改了基础字符串,因此必须从内存中读取*sp
两次,以确保在所有情况下都能正确执行。