LLVM-clang编译器优化器以非常奇怪的方式重新排列代码,该怎么办?

时间:2014-10-11 10:19:12

标签: c++ llvm llvm-clang

我有以下代码

renderer_opengl *oldr = (renderer_opengl*)enabler->renderer;
renderer *newr = new renderer;

void **vtable_old = ((void ***)oldr)[0];
void **vtable_new = ((void ***)newr)[0];

...

void *draw_new             = vtable_new[IDX_draw];
void *reshape_gl_new       = vtable_new[IDX_reshape_gl];
void *update_tile_new      = vtable_new[IDX_update_tile];    

// out << draw_new << std::endl;

p.verifyAccess(vtable_new, sizeof(void*)*32, true);
memcpy(vtable_new, vtable_old, sizeof(void*)*32);

out << draw_new << std::endl;

vtable_new[IDX_draw] = draw_new;
...

使用

进行编译
Apple LLVM version 6.0 (clang-600.0.51) (based on LLVM 3.5svn)

我在这里做的并不重要,但问题是编译器会重新排列代码,并在 draw_new之后将作业分配到memcpy ,以便在流出我看到vtable_old而不是vtable_new的地址!这种情况发生在-O3和偶数-O2。如果我取消注释第一个输出,一切都恢复正常。

这是什么 - 预期的行为,铿锵的错误或我错过了什么?如何解决?

修改

volatile添加到vtable_new声明

void ** volatile vtable_new = ((void ***)newr)[0];

帮助。 -fno-strict-aliasingasm volatile ("" : : : "memory")屏障没有。我仍然不明白编译器在这里做了什么。

1 个答案:

答案 0 :(得分:0)

正如其他人所说,我认为编译器正在利用严格的别名规则。尝试更换:

void **vtable_old = ((void ***)oldr)[0];
void **vtable_new = ((void ***)newr)[0];

使用:

void **vtable_old;
void **vtable_new;

memcpy( &vtable_old, oldr, sizeof(vtable_old));
memcpy( &vtable_new, newr, sizeof(vtable_new));