发布模式跳过部分代码

时间:2012-01-27 17:15:13

标签: c++ compiler-optimization

在尝试测试函数速度时,我发现并非我的代码的所有部分都以Release模式运行。但是,相同的代码在Debug模式下完美运行。

我正在使用VC ++编译器进行/O2优化。

这是剪切部分,不起作用。

int main()
{
    boost::timer::auto_cpu_timer t;

    for(int i = 0; i < 1000000; i++)
        gcdb(i, 5);
    return 0;
}

在发布模式下生成的程序集,for循环的代码仅在此模式下丢失。

int main()
{
000000013F8E1280  sub         rsp,88h  
000000013F8E1287  mov         rax,qword ptr [__security_cookie (013F8E7150h)]  
000000013F8E128E  xor         rax,rsp  
000000013F8E1291  mov         qword ptr [rsp+70h],rax  
    boost::timer::auto_cpu_timer t;
000000013F8E1296  lea         rcx,[t]  
000000013F8E129B  mov         edx,6  
000000013F8E12A0  call        boost::timer::auto_cpu_timer::auto_cpu_timer (013F8E2DA0h)  

    for(int i = 0; i < 1000000; i++)
        gcdb(i, 5);
    return 0;
000000013F8E12A5  lea         rcx,[t]  
000000013F8E12AA  call        boost::timer::auto_cpu_timer::~auto_cpu_timer (013F8E2810h)  
000000013F8E12AF  xor         eax,eax  
}

gcdb()只是查找两个数字的GCD的函数。

导致此代码跳过的原因是什么?

2 个答案:

答案 0 :(得分:8)

您在这里看到的是编译器优化,称为Dead Code Elimination

当编译器发现不需要某些代码的结果时,可以自由地消除它。这是所有现代编译器都采用的标准优化。

保持编译器不优化它的解决方法是以某种方式实际使用输出:

int main()
{
    boost::timer::auto_cpu_timer t;

    int sum = 0;

    for(int i = 0; i < 1000000; i++)
        sum += gcdb(i, 5);

    cout << sum << endl;
    return 0;
}

相关:How does GCC optimize out an unused variable incremented inside a loop?

答案 1 :(得分:2)

如果编译器可以证明没有副作用而你没有在任何地方使用结果,那么可以完全修剪该循环。

尝试对结果求和,然后从main返回整数和 - 这样就会产生一个可观察到的副作用,它会阻止优化器过于聪明。