我已经多次听到优化程序可能会重新排序我开始相信它的代码。 是否有任何可能发生这种情况的例子或典型案例,我怎样才能避免这样的事情(例如我希望基准不受此影响)?
答案 0 :(得分:5)
有许多不同类型的“代码运动”(移动代码),它是由优化过程的许多不同部分引起的:
x = sin(y)
一次或1000次,x
将具有相同的值,所以没有必要这样做在循环中。所以编译器将其移出。我确信我已经错过了上面列表中的一些案例,但这肯定是最常见的一些案例。
编译器完全有权这样做,只要它没有任何“可观察的差异”(除了运行所用的时间和使用的指令数量 - 那些“不计算”)在编译器方面存在可观察到的差异)
你可以做很少的事情来避免编译器重新排序你的代码 - 你可以编写一些代码来确保订单的某种程度。例如,我们可以使用这样的代码:
{
int sum = 0;
for(i = 0; i < large_number; i++)
sum += i;
}
现在,由于未使用sum
,编译器可以将其删除。添加一些检查打印总和的代码将确保根据编译器“使用”它。
同样地:
for(i = 0; i < large_number; i++)
{
do_stuff();
}
如果编译器可以发现do_stuff
实际上没有改变任何全局值或类似值,它会移动代码来形成这个:
do_stuff();
for(i = 0; i < large_number; i++)
{
}
编译器也可以删除 - 事实上几乎肯定会 - 现在是空循环,以便它根本不存在。 [正如评论中所提到的:如果do_stuff
实际上没有改变任何外部的东西,它也可能被移除,但我想到的例子是do_stuff
产生结果的地方,但结果是每次都一样]
(例如,如果您在Dhrystone基准测试中删除结果的打印输出,则会发生上述情况,因为某些循环会计算除打印输出之外从未使用的值 - 这可能会导致基准测试结果超出最高理论吞吐量处理器的大小为10左右 - 因为基准测试假定循环所需的指令实际上存在,并说它需要X个标称操作来执行每次迭代)
除了确保do_stuff
更新函数外部的某个变量,或返回“已使用”的值(例如汇总或其他内容)之外,没有简单的方法可以确保不会发生这种情况。
删除/省略代码的另一个例子是多次将值重复存储到同一个变量:
int x;
for(i = 0; i < large_number; i++)
x = i * i;
可以替换为:
x = (large_number-1) * (large_number-1);
有时,您可以使用volatile
来确保真正发生的事情,但在基准测试中,这可能是有害的,因为编译器也无法优化它应该优化的代码(如果您不小心)你如何使用volatile
)。
如果您有一些特别关注的SPECIFIC代码,最好发布它(并使用几个最先进的编译器进行编译,看看它们实际上用它做了什么)。
[请注意,移动代码通常不是一件坏事 - 我确实想要我的编译器(无论是我自己编写的编译器,还是我正在使用的编译器是由其他人编写的)通过移动代码进行优化,因为只要它正确地执行,它就会产生更快/更好的代码!]
答案 1 :(得分:2)
大多数情况下,只有在程序的可观察效果相同的情况下才允许重新排序 - 这意味着您无法分辨。
反例确实存在,例如操作数的顺序未指定,优化器可以自由重新排列。您无法预测这两个函数调用的顺序,例如:
int a = foo() + bar();
阅读sequence points以了解提供的保证。