为什么将此代码编译为C和C ++代码会生成不同的程序集?

时间:2013-11-18 08:43:27

标签: c++ c disassembly

我写了以下代码:

int main()
{
    int i;
    int arr[4];
    for (i = 0; i < 4; i++)
        arr[i] = 0;

    return 0;
}

将其保存在两个文件中:test.c和test.cpp
我运行以下命令:

gcc -O0 test.c
objdump -Mintel -d a.out > decompilec
g++ -O0 test.cpp
objdump -Mintel -d a.out > decompilecpp

我编辑了decompilec和decompilecpp,只包含主函数。

现在,我运行diff decompilec decompilecpp并获得以下输出:

12,21c12,19
<  80483fe: 7e eb                   jle    80483eb <main+0xf>
<  8048400: b8 00 00 00 00          mov    eax,0x0
<  8048405: c9                      leave  
<  8048406: c3                      ret    
<  8048407: 66 90                   xchg   ax,ax
<  8048409: 66 90                   xchg   ax,ax
<  804840b: 66 90                   xchg   ax,ax
<  804840d: 66 90                   xchg   ax,ax
<  804840f: 90                      nop
< 
---
>  80483fe: 0f 9e c0                setle  al
>  8048401: 84 c0                   test   al,al
>  8048403: 75 e6                   jne    80483eb <main+0xf>
>  8048405: b8 00 00 00 00          mov    eax,0x0
>  804840a: c9                      leave  
>  804840b: c3                      ret    
>  804840c: 66 90                   xchg   ax,ax
>  804840e: 66 90                   xchg   ax,ax

任何机构都能解释这种差异吗?

这是文件:

decompilec

080483dc <main>:
 80483dc:   55                      push   ebp
 80483dd:   89 e5                   mov    ebp,esp
 80483df:   83 ec 20                sub    esp,0x20
 80483e2:   c7 45 ec 00 00 00 00    mov    DWORD PTR [ebp-0x14],0x0
 80483e9:   eb 0f                   jmp    80483fa <main+0x1e>
 80483eb:   8b 45 ec                mov    eax,DWORD PTR [ebp-0x14]
 80483ee:   c7 44 85 f0 00 00 00    mov    DWORD PTR [ebp+eax*4-0x10],0x0
 80483f5:   00 
 80483f6:   83 45 ec 01             add    DWORD PTR [ebp-0x14],0x1
 80483fa:   83 7d ec 03             cmp    DWORD PTR [ebp-0x14],0x3
 80483fe:   7e eb                   jle    80483eb <main+0xf>
 8048400:   b8 00 00 00 00          mov    eax,0x0
 8048405:   c9                      leave  
 8048406:   c3                      ret    
 8048407:   66 90                   xchg   ax,ax
 8048409:   66 90                   xchg   ax,ax
 804840b:   66 90                   xchg   ax,ax
 804840d:   66 90                   xchg   ax,ax
 804840f:   90                      nop

decompilecpp

080483dc <main>:
 80483dc:   55                      push   ebp
 80483dd:   89 e5                   mov    ebp,esp
 80483df:   83 ec 20                sub    esp,0x20
 80483e2:   c7 45 ec 00 00 00 00    mov    DWORD PTR [ebp-0x14],0x0
 80483e9:   eb 0f                   jmp    80483fa <main+0x1e>
 80483eb:   8b 45 ec                mov    eax,DWORD PTR [ebp-0x14]
 80483ee:   c7 44 85 f0 00 00 00    mov    DWORD PTR [ebp+eax*4-0x10],0x0
 80483f5:   00 
 80483f6:   83 45 ec 01             add    DWORD PTR [ebp-0x14],0x1
 80483fa:   83 7d ec 03             cmp    DWORD PTR [ebp-0x14],0x3
 80483fe:   0f 9e c0                setle  al
 8048401:   84 c0                   test   al,al
 8048403:   75 e6                   jne    80483eb <main+0xf>
 8048405:   b8 00 00 00 00          mov    eax,0x0
 804840a:   c9                      leave  
 804840b:   c3                      ret    
 804840c:   66 90                   xchg   ax,ax
 804840e:   66 90                   xchg   ax,ax

根据要求,这是gcc -v

的输出
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/i686-linux-gnu/4.7/lto-wrapper
Target: i686-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Ubuntu/Linaro 4.7.2-2ubuntu1' --with-bugurl=file:///usr/share/doc/gcc-4.7/README.Bugs --enable-languages=c,c++,go,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-4.7 --enable-shared --enable-linker-build-id --with-system-zlib --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --with-gxx-include-dir=/usr/include/c++/4.7 --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --enable-gnu-unique-object --enable-plugin --enable-objc-gc --enable-targets=all --disable-werror --with-arch-32=i686 --with-tune=generic --enable-checking=release --build=i686-linux-gnu --host=i686-linux-gnu --target=i686-linux-gnu
Thread model: posix
gcc version 4.7.2 (Ubuntu/Linaro 4.7.2-2ubuntu1) 

2 个答案:

答案 0 :(得分:2)

使用汇编程序可以通过多种方式执行某些特定操作。特别是当您进行任何可能非常依赖于目标CPU的优化时,汇编程序可能会有非显而易见的操作,这些操作基本上可以使特定的CPU更快地工作。即使你有相同的编译器和相同的优化标志,所使用的实际编译器对于C和C ++仍然是不同的,因此它们可能产生不同的代码。

C大会应该很简单。 C ++版本更有趣。在this link解释了会发生什么。基本上他们将简单的“如果少于或等于”的C代码转换为“设置为零或非零,取决于是否小于等于,然后根据零或非零跳转”。

我不知道为什么C ++编译器会产生这样的代码。它可能会随着更高的优化级别而改变,或者甚至通过优化级别0生成,因为它有助于分支预测默认CPU以在大多数时间产生正确的预测。然后C编译器具有不同的默认行为。正如我已经说过的,实际编译器是不同的,所以我实际上有点惊讶代码是相同的,否则!

答案 1 :(得分:1)

不同的语言使用不同的编译器前端,这可能会产生不同的指令流(否则会产生相同的语义效果)。

如果你正在优化输出,很可能(尽管不能保证)优化器会将两个指令流减少到相同的输出......但是没有保证,我不明白为什么你会期望任何。