我在gcc中遇到了一个关于标有__attribute((const))
的运算符和函数的非常奇怪的行为。逻辑和算术运算符导致不同的优化,我不明白为什么。
这不是一个真正的错误,因为__attribute((const))
只是一个提示,并且不能保证其效果,但这仍然是非常令人惊讶的。有人有任何解释吗?
这是代码。所以我定义了一个__attribute((const))
函数:
int f(int & counter) __attribute((const));
int f(int & counter) {
++counter;
return 0;
}
然后我定义了一个运算符测试宏。这是通过宏而不是模板/仿函数来完成的,以便向编译器提供简单的代码并简化优化:
int global = 0; // forces results to be computed
#define TestOp(OP) \
{ \
int n = 0; \
global += (f(n) OP f(n)); \
std::cout << "op" #OP " calls f " << n << " times" << std::endl; \
}
最后,我按如下方式测试不同的运算符。评论与g++-4.8 -std=c++11 -O2 -Wall -pedantic
和-O3
-Ofast
相同输出的输出相匹配
int main() {
// all calls optimized away
TestOp(^) // 0
TestOp(-) // 0
// one call is optimized away
TestOp(|) // 1
TestOp(&) // 1
TestOp(||) // 1
TestOp(&&) // 1
// no optimization
TestOp(+) // 2
TestOp(*) // 2
return global;
}
我的问题是:为什么算术运算符会产生两个调用?为什么f()+f()
无法优化2*f()
?有没有办法帮助/强制进行这种优化?
起初我认为乘法可能更昂贵,但我尝试使用f()+....+f()
并且10次添加仍然没有减少到10*f()
。此外,由于它是int
算术,因此操作顺序无关紧要(与float
s相反)。
我也检查了asm但它没有帮助:所有的int似乎都是在编译时预先计算的。
答案 0 :(得分:5)
编译器不信任你。
由于您有一个引用参数,编译器似乎不信任您的const
属性 - const
函数应该只查看通过参数传递的值(不是引用或取消引用指针)。 / p>
另一种测试方法是在单独的编译单元中打破const
函数:
test1.cpp:
#include <stdio.h>
int global = 0; // forces results to be computed
int f(int i) __attribute((const));
void print_count(void);
#define TestOp(OP) \
{ \
int n = 0; \
global += (f(n) OP f(n)); \
printf("op %s ", #OP);\
print_count();\
}
int main() {
// all calls optimized away
TestOp(^) // 0
TestOp(-) // 0
// one call is optimized away
TestOp(|) // 1
TestOp(&) // 1
TestOp(||) // 1
TestOp(&&) // 1
// no optimization
TestOp(+) // 2
TestOp(*) // 2
return global;
}
counter.cpp:
#include <stdio.h>
static int counter = 0;
int f(int i) {
++counter;
return 0;
}
void print_count(void)
{
printf("counter %d\n", counter);
counter = 0;
}
现在,编译器发现在f(0)
之前无需调用f(0) | f(0)
,并且对f(0)
的调用结果将重新用于其他情况。
$ g++ -O2 -c counter.cpp && g++ -O2 -c test.cpp && g++ counter.o test.o && ./a.out
op ^ counter 0
op - counter 0
op | counter 1
op & counter 0
op || counter 0
op && counter 0
op + counter 0
op * counter 0