我写了以下代码:
int main()
{
int i;
int arr[4];
for (i = 0; i < 4; i++)
arr[i] = 0;
return 0;
}
将其保存在两个文件中:test.c和test.cpp
我运行以下命令:
gcc -O0 test.c
objdump -Mintel -d a.out > decompilec
g++ -O0 test.cpp
objdump -Mintel -d a.out > decompilecpp
我编辑了decompilec和decompilecpp,只包含主函数。
现在,我运行diff decompilec decompilecpp
并获得以下输出:
12,21c12,19
< 80483fe: 7e eb jle 80483eb <main+0xf>
< 8048400: b8 00 00 00 00 mov eax,0x0
< 8048405: c9 leave
< 8048406: c3 ret
< 8048407: 66 90 xchg ax,ax
< 8048409: 66 90 xchg ax,ax
< 804840b: 66 90 xchg ax,ax
< 804840d: 66 90 xchg ax,ax
< 804840f: 90 nop
<
---
> 80483fe: 0f 9e c0 setle al
> 8048401: 84 c0 test al,al
> 8048403: 75 e6 jne 80483eb <main+0xf>
> 8048405: b8 00 00 00 00 mov eax,0x0
> 804840a: c9 leave
> 804840b: c3 ret
> 804840c: 66 90 xchg ax,ax
> 804840e: 66 90 xchg ax,ax
任何机构都能解释这种差异吗?
这是文件:
decompilec
080483dc <main>:
80483dc: 55 push ebp
80483dd: 89 e5 mov ebp,esp
80483df: 83 ec 20 sub esp,0x20
80483e2: c7 45 ec 00 00 00 00 mov DWORD PTR [ebp-0x14],0x0
80483e9: eb 0f jmp 80483fa <main+0x1e>
80483eb: 8b 45 ec mov eax,DWORD PTR [ebp-0x14]
80483ee: c7 44 85 f0 00 00 00 mov DWORD PTR [ebp+eax*4-0x10],0x0
80483f5: 00
80483f6: 83 45 ec 01 add DWORD PTR [ebp-0x14],0x1
80483fa: 83 7d ec 03 cmp DWORD PTR [ebp-0x14],0x3
80483fe: 7e eb jle 80483eb <main+0xf>
8048400: b8 00 00 00 00 mov eax,0x0
8048405: c9 leave
8048406: c3 ret
8048407: 66 90 xchg ax,ax
8048409: 66 90 xchg ax,ax
804840b: 66 90 xchg ax,ax
804840d: 66 90 xchg ax,ax
804840f: 90 nop
decompilecpp
080483dc <main>:
80483dc: 55 push ebp
80483dd: 89 e5 mov ebp,esp
80483df: 83 ec 20 sub esp,0x20
80483e2: c7 45 ec 00 00 00 00 mov DWORD PTR [ebp-0x14],0x0
80483e9: eb 0f jmp 80483fa <main+0x1e>
80483eb: 8b 45 ec mov eax,DWORD PTR [ebp-0x14]
80483ee: c7 44 85 f0 00 00 00 mov DWORD PTR [ebp+eax*4-0x10],0x0
80483f5: 00
80483f6: 83 45 ec 01 add DWORD PTR [ebp-0x14],0x1
80483fa: 83 7d ec 03 cmp DWORD PTR [ebp-0x14],0x3
80483fe: 0f 9e c0 setle al
8048401: 84 c0 test al,al
8048403: 75 e6 jne 80483eb <main+0xf>
8048405: b8 00 00 00 00 mov eax,0x0
804840a: c9 leave
804840b: c3 ret
804840c: 66 90 xchg ax,ax
804840e: 66 90 xchg ax,ax
根据要求,这是gcc -v
:
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/i686-linux-gnu/4.7/lto-wrapper
Target: i686-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Ubuntu/Linaro 4.7.2-2ubuntu1' --with-bugurl=file:///usr/share/doc/gcc-4.7/README.Bugs --enable-languages=c,c++,go,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-4.7 --enable-shared --enable-linker-build-id --with-system-zlib --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --with-gxx-include-dir=/usr/include/c++/4.7 --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --enable-gnu-unique-object --enable-plugin --enable-objc-gc --enable-targets=all --disable-werror --with-arch-32=i686 --with-tune=generic --enable-checking=release --build=i686-linux-gnu --host=i686-linux-gnu --target=i686-linux-gnu
Thread model: posix
gcc version 4.7.2 (Ubuntu/Linaro 4.7.2-2ubuntu1)
答案 0 :(得分:2)
使用汇编程序可以通过多种方式执行某些特定操作。特别是当您进行任何可能非常依赖于目标CPU的优化时,汇编程序可能会有非显而易见的操作,这些操作基本上可以使特定的CPU更快地工作。即使你有相同的编译器和相同的优化标志,所使用的实际编译器对于C和C ++仍然是不同的,因此它们可能产生不同的代码。
C大会应该很简单。 C ++版本更有趣。在this link解释了会发生什么。基本上他们将简单的“如果少于或等于”的C代码转换为“设置为零或非零,取决于是否小于等于,然后根据零或非零跳转”。
我不知道为什么C ++编译器会产生这样的代码。它可能会随着更高的优化级别而改变,或者甚至通过优化级别0生成,因为它有助于分支预测默认CPU以在大多数时间产生正确的预测。然后C编译器具有不同的默认行为。正如我已经说过的,实际编译器是不同的,所以我实际上有点惊讶代码是相同的,否则!
答案 1 :(得分:1)
不同的语言使用不同的编译器前端,这可能会产生不同的指令流(否则会产生相同的语义效果)。
如果你正在优化输出,很可能(尽管不能保证)优化器会将两个指令流减少到相同的输出......但是没有保证,我不明白为什么你会期望任何。