Question

const double pi = 3.1415926535897;

static double mysin(double x) {
    return ((((((-0.000140298 * x - 0.00021075890) * x + 0.008703147) * x -
        0.0003853080) * x - 0.16641544) * x - 0.00010117316) * x +
        1.000023121) * x;
}

static void Main(string[] args) {
    Stopwatch sw = new Stopwatch();

    double a = 0;
    double[] arg = new double[1000000];
    for (int i = 0; i < 1000000; i++) {
        arg[i] = (pi / 2000000);
    } 
    sw.Restart();
    for (int i = 0; i < 1000000; i++) {
        a = a + Math.Sin(arg[i]);
    }
    sw.Stop();
    double t1 = (double)(sw.Elapsed.TotalMilliseconds);

    a = 0;
    sw.Restart();
    for (int i = 0; i < 1000000; i++) {
        a = a + mysin(arg[i]);
    }
    sw.Stop();
    double t2 = (double)(sw.Elapsed.TotalMilliseconds);
    Console.WriteLine("{0}\n{1}\n", t1,t2);
    Console.Read(); 
}

此幂级数对[0，pi / 2]有效，并且比释放模式下的内置正弦函数慢10倍。 1ms vs 10ms。

但是当我将粘贴mysin代码复制到函数中时，我几乎在发布时得到了相同的时间，而在调试模式下，我的代码速度提高了大约4倍。

a = 0;
sw.Restart();
for (int i = 0; i < 1000000; i++) {
    double x = arg[i];
    a = a + ((((((-0.000140298 * x - 0.00021075890) * x + 0.008703147) * x -
        0.0003853080) * x - 0.16641544) * x - 0.00010117316) * x +
        1.000023121) * x;
    //a = a + mysin(arg[i]);
}

这里的交易是什么？如何更快地进行此类计算？我猜测代码会自动识别不应该调用sin算法，而是将粘贴复制到循环中。如何让编译器为我做同样的事情。

还有一个问题，c ++会对其默认的sin / cos函数进行相同的优化吗？如果不是，我将如何确保它确实如此。编辑：我测试了它和我的正弦函数（如果条件被添加以将域扩展为全部，则额外增加4个）运行速度比默认的sin函数快25％（虽然不准确）。事实上，复制粘贴版本比我将其作为单独的函数编写时运行速度慢。

Answer 1

我假设你在x86上测试了这个，因为我不能在x64上重现这些数字。在x64上，您的代码实际上看起来更快。

我反汇编了x86 / release的代码。产生差异的原因在于您的方法就是这样一种方法，而Math.Sin被编译为直接使用x86 fsin指令，从而消除了每次调用的函数调用。

FWIW，x64代码完全不同。 Math.Sin已翻译为clr!COMDouble::Sin。

请参阅FSIN。

为什么我的正弦算法比默认算法慢得多？

1 个答案: