如何让MSVC编译器优化多步POD初始化?

时间:2018-06-06 22:58:59

标签: c++ optimization visual-c++ c++17 clang++

我已经制作了这个示例代码:

#include <vector>

struct POD {
    int a;
    int b;
    int c;

    inline static POD make_pod_with_default()
    {
        POD p{ 41, 51, 61 };
        return p;
    }

    inline void change_pod_a(POD &p, int a) {
        p.a = a;
    }

    inline void change_pod_b(POD &p, int b) {
        p.b = b;
    }

    static POD make_pod_with_a(int a) {
        POD p = make_pod_with_default();
        p.change_pod_a(p, a);
        return p;
    }

    static POD make_pod_with_b(int a) {
        POD p = make_pod_with_default();
        p.change_pod_b(p, a);
        return p;
    }
};

int main()
{
    std::vector<POD> vec{};
    vec.reserve(2);
    vec.push_back(POD::make_pod_with_a(71));
    vec.push_back(POD::make_pod_with_b(81));
    return vec[0].a + vec[0].b + vec[0].c + vec[1].a + vec[1].b + vec[1].c;
}

在编译的汇编代码中,我们可以看到为第一个vec.push_back(...)调用生成了以下指令:

...
mov      DWORD PTR $T2[esp+32], 41 ; 00000029H
...
mov      DWORD PTR $T2[esp+36], 51 ; 00000033H
...
mov      DWORD PTR $T5[esp+32], 71 ; 00000047H
...
mov      DWORD PTR $T6[esp+44], 61 ; 0000003dH
...

对于71,有一个到[esp + 32]的mov,但41的mov到[esp + 32]仍然存在,没用!如何为MSVC编写能够实现这种优化的代码,MSVC是否能够实现这一目标?

GCC和CLANG都提供了更优化的版本,但是CLANG以非常干净和合乎逻辑的方式大幅度地失败,没有任何开销:

CLANG生成代码:

main: # @main
push rax
mov edi, 24
call operator new(unsigned long)
mov rdi, rax
call operator delete(void*)
mov eax, 366
pop rcx
ret

一切都在编译时完成,因为71 + 51 + 61 + 41 + 81 + 61 = 366! 我必须承认看到我的程序在编译时计算并且仍然在程序集中调用vec.reserve()时我很痛苦...但到目前为止CLANG仍然需要蛋糕!来吧MSVC,这不是易失性的载体。

1 个答案:

答案 0 :(得分:1)

如果您转换方法constexpr,则可以执行以下操作:

constexpr POD step_one()
{
    POD p{2, 5, 11};
    p.b = 3;
    return p;
}

constexpr void step_two(POD &p)
{
    p.c = 5;
}

constexpr POD make_pod(){
    POD p = step_one();
    step_two(p);
    return p;
}

POD make_pod_final()
{
    constexpr POD res = make_pod();
    return res;
}

导致:

make_pod_final PROC
    mov      eax, DWORD PTR $T1[esp-4]
    mov      DWORD PTR [eax], 2
    mov      DWORD PTR [eax+4], 3
    mov      DWORD PTR [eax+8], 5
    ret      0

Demo