Question

自从我几个星期前开始使用以来，我已经看到了这两个并行短语，需要有C编译器知识的人告诉我哪些能带来更好的代码。

版本1：

char s[]="aString",*sp=&s,c;
while(c=*sp++){
operation(c);
}

版本2：

char s[]="aString",*sp=&s;
for(;*sp;sp++){
 operation(*sp);
}

好吧，我知道版本2涉及一些重复差异，因此版本1总是比版本2好吗？如果没有，有什么典型的例外？

Answer 1

我希望在任何合理的优化级别都能完全相同 - 你试过吗？

编辑：

我想确认一下，所以我尝试了。这是我的示例程序（我也修复了指针不匹配错误）：

void operation(char);

void f1(void)
{
    char s[]="aString",*sp=s,c;
    while(c=*sp++) {
        operation(c);
    }
}

void f2(void)
{
    char s[]="aString",*sp=s;
    for(;*sp;sp++) {
         operation(*sp);
    }
}

在Mac上的-O3处使用clang编译，这是目标文件：

example.o:
(__TEXT,__text) section
_f1:
0000000000000000    pushq   %rbp
0000000000000001    movq    %rsp,%rbp
0000000000000004    pushq   %rbx
0000000000000005    pushq   %rax
0000000000000006    movq    $0x00676e6972745361,%rax
0000000000000010    movq    %rax,0xf0(%rbp)
0000000000000014    movb    $0x61,%al
0000000000000016    leaq    0xf1(%rbp),%rbx
000000000000001a    nopw    _f1(%rax,%rax)
0000000000000020    movsbl  %al,%edi
0000000000000023    callq   _operation
0000000000000028    movb    (%rbx),%al
000000000000002a    incq    %rbx
000000000000002d    testb   %al,%al
000000000000002f    jne 0x00000020
0000000000000031    addq    $0x08,%rsp
0000000000000035    popq    %rbx
0000000000000036    popq    %rbp
0000000000000037    ret
0000000000000038    nopl    _f1(%rax,%rax)
_f2:
0000000000000040    pushq   %rbp
0000000000000041    movq    %rsp,%rbp
0000000000000044    pushq   %rbx
0000000000000045    pushq   %rax
0000000000000046    movq    $0x00676e6972745361,%rax
0000000000000050    movq    %rax,0xf0(%rbp)
0000000000000054    movb    $0x61,%al
0000000000000056    leaq    0xf1(%rbp),%rbx
000000000000005a    nopw    _f1(%rax,%rax)
0000000000000060    movsbl  %al,%edi
0000000000000063    callq   _operation
0000000000000068    movb    (%rbx),%al
000000000000006a    incq    %rbx
000000000000006d    testb   %al,%al
000000000000006f    jne 0x00000060
0000000000000071    addq    $0x08,%rsp
0000000000000075    popq    %rbx
0000000000000076    popq    %rbp
0000000000000077    ret

如你所见，字面意思相同。

Answer 2

现在，任何好的编译器都会编译这些循环几乎完全相同。

如果输入更短或使代码更易于阅读，您可能希望使用临时变量c。但是不要为了某种想象的性能优势而做这样的事情。

Answer 3

任何有价值的优化编译器都会将它们优化为相同的汇编代码。除非您使用剖析器测量了这一点，并确定它是一个瓶颈，否则不要试图过早地优化它。

在某些情况下，如果值被多次访问，编译器将无法确定基础字符串是否不会发生变化，在这种情况下，它必须执行内存访问不止一次。在这些情况下，在变量中缓存字符会有一点点优势，但即使这样，优势也会非常小。像这样：

for( ; *sp; sp++) {
    operation1(*sp);
    some_function(sp);
    operation2(*sp);
}

在这种情况下，编译器可能不知道some_function是否修改了基础字符串，因此必须从内存中读取*sp两次，以确保在所有情况下都能正确执行。

迭代字符串时，是否比derefferencing更好地分配临时字符？

3 个答案: