迭代字符串时,是否比derefferencing更好地分配临时字符?

时间:2012-08-05 04:41:05

标签: c idioms

自从我几个星期前开始使用以来,我已经看到了这两个并行短语,需要有C编译器知识的人告诉我哪些能带来更好的代码。

版本1:

char s[]="aString",*sp=&s,c;
while(c=*sp++){
operation(c);
}

版本2:

char s[]="aString",*sp=&s;
for(;*sp;sp++){
 operation(*sp);
}


好吧,我知道版本2涉及一些重复差异,因此版本1总是比版本2好吗?如果没有,有什么典型的例外?

3 个答案:

答案 0 :(得分:3)

我希望在任何合理的优化级别都能完全相同 - 你试过吗?

编辑:

我想确认一下,所以尝试了。这是我的示例程序(我也修复了指针不匹配错误):

void operation(char);

void f1(void)
{
    char s[]="aString",*sp=s,c;
    while(c=*sp++) {
        operation(c);
    }
}

void f2(void)
{
    char s[]="aString",*sp=s;
    for(;*sp;sp++) {
         operation(*sp);
    }
}

在Mac上的-O3处使用clang编译,这是目标文件:

example.o:
(__TEXT,__text) section
_f1:
0000000000000000    pushq   %rbp
0000000000000001    movq    %rsp,%rbp
0000000000000004    pushq   %rbx
0000000000000005    pushq   %rax
0000000000000006    movq    $0x00676e6972745361,%rax
0000000000000010    movq    %rax,0xf0(%rbp)
0000000000000014    movb    $0x61,%al
0000000000000016    leaq    0xf1(%rbp),%rbx
000000000000001a    nopw    _f1(%rax,%rax)
0000000000000020    movsbl  %al,%edi
0000000000000023    callq   _operation
0000000000000028    movb    (%rbx),%al
000000000000002a    incq    %rbx
000000000000002d    testb   %al,%al
000000000000002f    jne 0x00000020
0000000000000031    addq    $0x08,%rsp
0000000000000035    popq    %rbx
0000000000000036    popq    %rbp
0000000000000037    ret
0000000000000038    nopl    _f1(%rax,%rax)
_f2:
0000000000000040    pushq   %rbp
0000000000000041    movq    %rsp,%rbp
0000000000000044    pushq   %rbx
0000000000000045    pushq   %rax
0000000000000046    movq    $0x00676e6972745361,%rax
0000000000000050    movq    %rax,0xf0(%rbp)
0000000000000054    movb    $0x61,%al
0000000000000056    leaq    0xf1(%rbp),%rbx
000000000000005a    nopw    _f1(%rax,%rax)
0000000000000060    movsbl  %al,%edi
0000000000000063    callq   _operation
0000000000000068    movb    (%rbx),%al
000000000000006a    incq    %rbx
000000000000006d    testb   %al,%al
000000000000006f    jne 0x00000060
0000000000000071    addq    $0x08,%rsp
0000000000000075    popq    %rbx
0000000000000076    popq    %rbp
0000000000000077    ret

如你所见,字面意思相同。

答案 1 :(得分:1)

现在,任何好的编译器都会编译这些循环几乎完全相同。

如果输入更短或使代码更易于阅读,您可能希望使用临时变量c。但是不要为了某种想象的性能优势而做这样的事情。

答案 2 :(得分:0)

任何有价值的优化编译器都会将它们优化为相同的汇编代码。除非您使用剖析器测量了这一点,并确定它是一个瓶颈,否则不要试图过早地优化它。

在某些情况下,如果值被多次访问,编译器将无法确定基础字符串是否不会发生变化,在这种情况下,它必须执行内存访问不止一次。在这些情况下,在变量中缓存字符会有一点点优势,但即使这样,优势也会非常小。像这样:

for( ; *sp; sp++) {
    operation1(*sp);
    some_function(sp);
    operation2(*sp);
}

在这种情况下,编译器可能不知道some_function是否修改了基础字符串,因此必须从内存中读取*sp两次,以确保在所有情况下都能正确执行。