为什么vs c ++ 2010编译器为类似函数生成不同的汇编代码

时间:2012-03-23 17:47:46

标签: c++ c assembly

所以最近我考虑strcpy并回到K& R,他们将实现显示为

while (*dst++ = *src++) ;

但我错误地将其转录为:

while (*dst = *src)
{
    src++; //technically could be ++src on these lines
    dst++; 
}

在任何情况下,让我想到编译器是否会为这两个实际生成不同的代码。我最初的想法是它们应该几乎相同,因为src和dst正在递增但从未使用过我认为编译器会知道不会尝试在生成的机器代码中将它们作为“变量”进行实际保存。

在32位发布模式(/ O2)中使用Windows 7和VS 2010 C ++ SP1构建,我获得了上述两种版本的反汇编代码。为了防止函数本身直接引用输入并进行内联,我使用每个函数创建了一个dll。我省略了制作的ASM的序言和结语。

    while (*dst++ = *src++)
6EBB1003 8B 55 08             mov         edx,dword ptr [src]     
6EBB1006 8B 45 0C             mov         eax,dword ptr [dst]     
6EBB1009 2B D0                sub         edx,eax                //prepare edx so that edx + eax always points to src     
6EBB100B EB 03                jmp         docopy+10h (6EBB1010h)  
6EBB100D 8D 49 00             lea         ecx,[ecx]              //looks like align padding, never hit this line
6EBB1010 8A 0C 02             mov         cl,byte ptr [edx+eax]  //ptr [edx+ eax] points to char in src  :loop begin
6EBB1013 88 08                mov         byte ptr [eax],cl      //copy char to dst
6EBB1015 40                   inc         eax                    //inc src ptr
6EBB1016 84 C9                test        cl,cl                  // check for 0 (null terminator)
6EBB1018 75 F6                jne         docopy+10h (6EBB1010h)  //if not goto :loop begin
        ;

上面我注释了代码,基本上是一个循环,只有1个检查null和1个内存副本。

现在让我们来看看我的错误版本:

    while (*dst = *src)
6EBB1003 8B 55 08             mov         edx,dword ptr [src]  
6EBB1006 8A 0A                mov         cl,byte ptr [edx]  
6EBB1008 8B 45 0C             mov         eax,dword ptr [dst]  
6EBB100B 88 08                mov         byte ptr [eax],cl       //copy 0th char to dst
6EBB100D 84 C9                test        cl,cl                   //check for 0
6EBB100F 74 0D                je          docopy+1Eh (6EBB101Eh)  // return if we encounter null terminator
6EBB1011 2B D0                sub         edx,eax  
6EBB1013 8A 4C 02 01          mov         cl,byte ptr [edx+eax+1]  //get +1th char  :loop begin
    {
        src++;
        dst++;
6EBB1017 40                   inc         eax                   
6EBB1018 88 08                mov         byte ptr [eax],cl        //copy above char to dst
6EBB101A 84 C9                test        cl,cl                    //check for 0
6EBB101C 75 F5                jne         docopy+13h (6EBB1013h)   // if not goto :loop begin
    }

在我的版本中,我看到它首先将第0个字符复制到目标,然后检查null,然后最后进入循环,再次检查null。所以循环基本保持不变,但现在它处理循环前的第0个字符。与第一种情况相比,这当然是次优的。

我想知道是否有人知道为什么阻止编译器制作与第一个示例相同(或接近相同)的代码。这是ms编译器特定问题还是可能与我的编译器/链接器设置有关?


这里是完整的代码,2个文件(1个函数替换另一个)。

// in first dll project
__declspec(dllexport) void docopy(const char* src, char* dst)
{
    while (*dst++ = *src++);
}

__declspec(dllexport) void docopy(const char* src, char* dst)
{
    while (*dst = *src)
    {
        ++src;
        ++dst;
    }
}


//seprate main.cpp file calls docopy
void docopy(const char* src, char* dst);
char* source ="source";
char destination[100];
int main()
{

    docopy(source, destination);
}

3 个答案:

答案 0 :(得分:10)

因为在第一个例子中,即使src开始指向空字符,也会始终发生后递增。在相同的起始情况下,第二个示例不会增加指针。

答案 1 :(得分:2)

当然编译器还有其他选择。 “复制第一个字节然后进入循环,如果不是0”是gcc-4.5.1用-O1产生的。使用-O2和-O3,它会产生

.LFB0:
    .cfi_startproc
    jmp     .L6             // jump to copy
    .p2align 4,,10
    .p2align 3
.L4:
    addq    $1, %rdi        // increment pointers
    addq    $1, %rsi
.L6:                        // copy
    movzbl  (%rdi), %eax    // get source byte
    testb   %al, %al        // check for 0
    movb    %al, (%rsi)     // move to dest
    jne     .L4             // loop if nonzero
    rep
    ret
    .cfi_endproc

与它为K& R循环产生的非常相似。这实际上是否更好,我不能说,但它看起来更好。

除了跳入循环外,K& R循环的指令完全相同,只是采用不同的方式:

.LFB0:
    .cfi_startproc
    .p2align 4,,10
    .p2align 3
.L2:
    movzbl  (%rdi), %eax    // get source byte
    addq    $1, %rdi        // increment source pointer
    movb    %al, (%rsi)     // move byte to dest
    addq    $1, %rsi        // increment dest pointer
    testb   %al, %al        // check for 0
    jne     .L2             // loop if nonzero
    rep
    ret
    .cfi_endproc

答案 2 :(得分:0)

你的第二个代码没有“再次检查null”。在第二个版本中,循环体使用edx+eax+1地址处的字符(注意+1部分),这将是字符编号1,2,3等等。序言代码使用字符编号0.这意味着代码永远不会检查相同的字符两次,正如您似乎相信的那样。那里没有“再次”。

第二个代码是一个更复杂的机器人(循环的第一次迭代被有效地从它中拉出),因为已经解释过它的功能是不同的。指针的最终值在你的拳头和第二个版本之间有所不同。