在尝试测试函数速度时,我发现并非我的代码的所有部分都以Release
模式运行。但是,相同的代码在Debug
模式下完美运行。
我正在使用VC ++编译器进行/O2
优化。
这是剪切部分,不起作用。
int main()
{
boost::timer::auto_cpu_timer t;
for(int i = 0; i < 1000000; i++)
gcdb(i, 5);
return 0;
}
在发布模式下生成的程序集,for循环的代码仅在此模式下丢失。
int main()
{
000000013F8E1280 sub rsp,88h
000000013F8E1287 mov rax,qword ptr [__security_cookie (013F8E7150h)]
000000013F8E128E xor rax,rsp
000000013F8E1291 mov qword ptr [rsp+70h],rax
boost::timer::auto_cpu_timer t;
000000013F8E1296 lea rcx,[t]
000000013F8E129B mov edx,6
000000013F8E12A0 call boost::timer::auto_cpu_timer::auto_cpu_timer (013F8E2DA0h)
for(int i = 0; i < 1000000; i++)
gcdb(i, 5);
return 0;
000000013F8E12A5 lea rcx,[t]
000000013F8E12AA call boost::timer::auto_cpu_timer::~auto_cpu_timer (013F8E2810h)
000000013F8E12AF xor eax,eax
}
gcdb()
只是查找两个数字的GCD的函数。
导致此代码跳过的原因是什么?
答案 0 :(得分:8)
您在这里看到的是编译器优化,称为Dead Code Elimination。
当编译器发现不需要某些代码的结果时,可以自由地消除它。这是所有现代编译器都采用的标准优化。
保持编译器不优化它的解决方法是以某种方式实际使用输出:
int main()
{
boost::timer::auto_cpu_timer t;
int sum = 0;
for(int i = 0; i < 1000000; i++)
sum += gcdb(i, 5);
cout << sum << endl;
return 0;
}
相关:How does GCC optimize out an unused variable incremented inside a loop?
答案 1 :(得分:2)
如果编译器可以证明没有副作用而你没有在任何地方使用结果,那么可以完全修剪该循环。
尝试对结果求和,然后从main返回整数和 - 这样就会产生一个可观察到的副作用,它会阻止优化器过于聪明。