const double pi = 3.1415926535897;
static double mysin(double x) {
return ((((((-0.000140298 * x - 0.00021075890) * x + 0.008703147) * x -
0.0003853080) * x - 0.16641544) * x - 0.00010117316) * x +
1.000023121) * x;
}
static void Main(string[] args) {
Stopwatch sw = new Stopwatch();
double a = 0;
double[] arg = new double[1000000];
for (int i = 0; i < 1000000; i++) {
arg[i] = (pi / 2000000);
}
sw.Restart();
for (int i = 0; i < 1000000; i++) {
a = a + Math.Sin(arg[i]);
}
sw.Stop();
double t1 = (double)(sw.Elapsed.TotalMilliseconds);
a = 0;
sw.Restart();
for (int i = 0; i < 1000000; i++) {
a = a + mysin(arg[i]);
}
sw.Stop();
double t2 = (double)(sw.Elapsed.TotalMilliseconds);
Console.WriteLine("{0}\n{1}\n", t1,t2);
Console.Read();
}
此幂级数对[0,pi / 2]有效,并且比释放模式下的内置正弦函数慢10倍。 1ms vs 10ms。
但是当我将粘贴mysin
代码复制到函数中时,我几乎在发布时得到了相同的时间,而在调试模式下,我的代码速度提高了大约4倍。
a = 0;
sw.Restart();
for (int i = 0; i < 1000000; i++) {
double x = arg[i];
a = a + ((((((-0.000140298 * x - 0.00021075890) * x + 0.008703147) * x -
0.0003853080) * x - 0.16641544) * x - 0.00010117316) * x +
1.000023121) * x;
//a = a + mysin(arg[i]);
}
这里的交易是什么?如何更快地进行此类计算?我猜测代码会自动识别不应该调用sin算法,而是将粘贴复制到循环中。如何让编译器为我做同样的事情。
还有一个问题,c ++会对其默认的sin / cos函数进行相同的优化吗?如果不是,我将如何确保它确实如此。编辑:我测试了它和我的正弦函数(如果条件被添加以将域扩展为全部,则额外增加4个)运行速度比默认的sin函数快25%(虽然不准确)。事实上,复制粘贴版本比我将其作为单独的函数编写时运行速度慢。
答案 0 :(得分:3)
我假设你在x86上测试了这个,因为我不能在x64上重现这些数字。在x64上,您的代码实际上看起来更快。
我反汇编了x86 / release的代码。产生差异的原因在于您的方法就是这样一种方法,而Math.Sin
被编译为直接使用x86 fsin
指令,从而消除了每次调用的函数调用。
FWIW,x64代码完全不同。 Math.Sin
已翻译为clr!COMDouble::Sin
。
请参阅FSIN。