Question

我有一个奇怪的问题。我有以下代码：

template<clss index, class policy>
inline int CBase<index,policy>::func(const A& test_in, int* srcPtr ,int* dstPtr)
{
    int width = test_in.width();
    int height = test_in.height();

    double d = 0.0; //here is the problem
    for(int y = 0; y < height; y++)
    {

        //Pointer initializations

        //multiplication involving y
        //ex: int z = someBigNumber*y + someOtherBigNumber;
        for(int x = 0; x < width; x++)
        {
            //multiplication involving x
        //ex: int z = someBigNumber*x + someOtherBigNumber;
            if(soemCondition)
            {
                // floating point calculations
            }
            *dstPtr++ = array[*srcPtr++];
        }
    }
}

内循环执行近200,000次，整个功能需要100 ms才能完成。（使用AQTimer描述）

我在外部循环外面找到了一个未使用的变量double d = 0.0;并删除了它。在此更改之后，突然该方法花费500毫秒来执行相同数量的操作。（慢5倍）。

此行为可在具有不同处理器类型的不同计算机中重现。（Core2，双核处理器）。

我正在使用优化级别为O2的VC6编译器。 Follwing是使用的其他编译器选项：

 -MD -O2 -Z7 -GR -GX -G5 -X -GF -EHa

我怀疑编译器优化并删除了编译器优化/O2。在该功能变得正常之后，旧代码需要100ms。

有人可以对这种奇怪的行为有所了解吗？

为什么编译器优化会在我删除未使用的变量时降低性能？

注意：汇编代码（更改前后）看起来相同。

Answer 1

如果汇编代码在更改之前和之后看起来相同，则错误会以某种方式与您对函数计时的方式相关联。

Answer 2

VC6太糟糕了。众所周知，在几种情况下生成错误的代码，并且它的优化器也不是那么先进。编译器已有十多年的历史，多年来甚至都没有得到支持。

所以，答案是“你正在使用一个错误的编译器。期待错误行为，特别是在启用优化时。”

我不认为升级到现代编译器（或只是简单地测试代码）是一种选择吗？

显然，生成的程序集不能相同，否则就没有性能差异。

唯一的问题是的区别所在。并且有了一个错误的编译器，它可能是一些完全不相关的代码部分突然得到不同的编译和中断。最有可能的是，为此函数生成的汇编代码不相同，并且差异非常微妙，您没有注意到它们。

Answer 3

将width和height声明为const {unsigned}整数。 {应使用无符号，因为高度和宽度永远不会为负。}

const int width = test_in.width();
const int height = test_in.height();

这有助于编译器进行优化。值为const时，它可以将它们放在代码或寄存器中，因为它们不会发生变化。此外，它使编译器不必猜测变量是否在变化。

我建议使用未使用的double打印出版本的汇编代码。这将使您深入了解编译器的思考过程。

编译器优化导致性能降低

3 个答案: