如果我在Ubuntu 16.04 / gcc 7.3中编译以下内容
struct VecA {
float data[4];
};
struct VecB {
float x;
float y;
float z;
float w;
};
// Requires stack protection
VecA getA() {return {1.0f, 1.0f, 1.0f, 1.0f};}
// Does not require stack protection
VecB getB() {return {1.0f, 1.0f, 1.0f, 1.0f};}
像这样:
g++ -O3 -c -o result test.cpp
objdump -d result
我得到:
0000000000000000 <_Z4getAv>:
0: 48 83 ec 18 sub $0x18,%rsp
4: 64 48 8b 04 25 28 00 mov %fs:0x28,%rax
b: 00 00
d: 48 89 44 24 08 mov %rax,0x8(%rsp)
12: 31 c0 xor %eax,%eax
14: f3 0f 7e 05 00 00 00 movq 0x0(%rip),%xmm0 # 1c <_Z4getAv+0x1c>
1b: 00
1c: 48 8b 44 24 08 mov 0x8(%rsp),%rax
21: 64 48 33 04 25 28 00 xor %fs:0x28,%rax
28: 00 00
2a: 75 09 jne 35 <_Z4getAv+0x35>
2c: 66 0f 6f c8 movdqa %xmm0,%xmm1
30: 48 83 c4 18 add $0x18,%rsp
34: c3 retq
35: e8 00 00 00 00 callq 3a <_Z4getAv+0x3a>
3a: 66 0f 1f 44 00 00 nopw 0x0(%rax,%rax,1)
0000000000000040 <_Z4getBv>:
40: f3 0f 7e 05 00 00 00 movq 0x0(%rip),%xmm0 # 48 <_Z4getBv+0x8>
47: 00
48: 66 0f 6f c8 movdqa %xmm0,%xmm1
4c: c3 retq
“看起来”像是将Linux堆栈保护应用于VecA
。有点防御性,但我可以理解编译器如何得出该结论。
但是,这让我感到困惑:
即使显式启用了堆栈保护,我也无法在godbolt.org上重现此内容。我可以使用-fstack-protector-all
来实现两个函数,但这是意料之中的,而且没意思。
https://gcc.godbolt.org/z/ePR98P
此外,似乎在我的系统上,显式使用堆栈保护程序正在从getA()
删除保护措施
g++ -O3 -c -o -fstack-protector result test.cpp
objdump -d result
0000000000000000 <_Z4getAv>:
0: f3 0f 7e 05 00 00 00 movq 0x0(%rip),%xmm0 # 8 <_Z4getAv+0x8>
7: 00
8: 66 0f 6f c8 movdqa %xmm0,%xmm1
c: c3 retq
d: 0f 1f 00 nopl (%rax)
0000000000000010 <_Z4getBv>:
10: f3 0f 7e 05 00 00 00 movq 0x0(%rip),%xmm0 # 18 <_Z4getBv+0x8>
17: 00
18: 66 0f 6f c8 movdqa %xmm0,%xmm1
1c: c3 retq
所以我的问题是:
为什么我的本地结果与godbolt.org上产生的结果有很大不同?
我的系统行为背后是否有合理的解释?特别是关于-fstack-protector
取消保护。
可以断言两个函数都应该在优化的代码中生成等效的程序集吗?
修改:
完整版本字符串:
g++ --version
g++ (Ubuntu 7.3.0-21ubuntu1~16.04) 7.3.0
Copyright (C) 2017 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
答案 0 :(得分:12)
Ubuntu的gcc的默认值为-fstack-protector-strong
,而不是-fstack-protector-all
。 (The gcc manual lists available options)。
https://lwn.net/Articles/584225/描述“强”。它确实很喜欢保护数组,但是没有数组成员的结构无法被索引,因此发生溢出的机会要少得多。
On Godbolt,像在您的台式机上那样,为VecA而不是VecB产生堆栈保护。 (顺便说一句,由于您已链接到Godbolt上的Intel语法,因此您可以使用g++ -S -masm=intel -O3
来获取Intel语法或objdump -drwC -Mintel
。)
您可以使用g++ -S -fverbose-asm -O3 foo.cpp
包含注释,这些注释显示了编译时使用的所有gcc隐式和显式选项。在Godbolt上,取消选中//
图标以不隐藏asm注释like this。
# GNU C++14 (GCC-Explorer-Build) version 7.3.0 (x86_64-linux-gnu)
# compiled by GNU C version 5.4.0 20160609, GMP version 6.1.0, MPFR version 3.1.4, MPC version 1.0.3, isl version isl-0.16.1-GMP
# GGC heuristics: --param ggc-min-expand=100 --param ggc-min-heapsize=131072
# options passed: -fdiagnostics-color=always -imultiarch x86_64-linux-gnu
# -iprefix /opt/compiler-explorer/gcc-7.3.0/bin/../lib/gcc/x86_64-linux-gnu/7.3.0/
# -D_GNU_SOURCE
# /tmp/compiler-explorer-compiler11885-54-1u26why.tdoy/example.cpp
# -masm=intel -mtune=generic -march=x86-64
# -auxbase-strip /tmp/compiler-explorer-compiler11885-54-1u26why.tdoy/output.s
# -g -O3 -std=gnu++14 -fstack-protector-strong -fverbose-asm
# options enabled: -faggressive-loop-optimizations -falign-labels
# -fasynchronous-unwind-tables -fauto-inc-dec -fbranch-count-reg
# -fcaller-saves -fchkp-check-incomplete-type -fchkp-check-read
# -fchkp-check-write -fchkp-instrument-calls -fchkp-narrow-bounds
# -fchkp-optimize -fchkp-store-bounds -fchkp-use-static-bounds
# -fchkp-use-static-const-bounds -fchkp-use-wrappers -fcode-hoisting
# -fcombine-stack-adjustments -fcommon -fcompare-elim -fcprop-registers
# -fcrossjumping -fcse-follow-jumps -fdefer-pop
...