Question

为什么PLINQ输出与顺序处理和Parallel.For循环

不同

我想添加10,000,000个数字的平方根。这是3个案例的代码：

循环顺序：

double sum = 0.0;
for(int i = 1;i<10000001;i++)
sum += Math.Sqrt(i);

输出为： 21081852648.717

现在使用Parallel.For循环：

object locker = new object();
double total ;

Parallel.For(1,10000001,
()=>0.0,
(i,state,local)=> local+Math.Sqrt(i),
(local)=>
{
  lock(locker){ total += local; }
}
);

输出为： 21081852648.7199

现在使用PLINQ

double tot =  ParallelEnumerable.Range(1, 10000000)
                .Sum(i => Math.Sqrt(i));

输出为： 21081852648.72

为什么PLINQ输出和Parallel.For和Sequential for loop之间有区别？

Answer 1

我强烈怀疑这是因为带双打的算术不是真正的联想。在对值进行求和时，信息可能会丢失，而信息的丢失将取决于操作的顺序。

以下是显示效果的示例：

using System;

class Test
{
    static void Main()
    {
        double d1 = 0d;
        for (int i = 0; i < 10000; i++)
        {
            d1 += 0.00000000000000001;
        }
        d1 += 1;
        Console.WriteLine(d1);

        double d2 = 1d;
        for (int i = 0; i < 10000; i++)
        {
            d2 += 0.00000000000000001;
        }
        Console.WriteLine(d2);
    }
}

在第一种情况下，我们可以多次添加非常小的数字，直到它们变得足够大，在添加到1时仍然相关。

在第二种情况下，将0.00000000000000001添加到1始终只会产生1，因为双精度中没有足够的信息来表示1.00000000000000001 - 所以最终结果仍然只有1.

编辑：我想到了另一个可能令人困惑的方面。对于局部变量，JIT编译器能够（并允许）使用80位FP寄存器，这意味着可以在较少信息丢失的情况下执行算术运算。那个不例如变量必须是64位的情况。在Parallel.For情况下，total变量实际上是生成的类中的实例变量，因为它是由lambda表达式捕获的。这个可以更改结果 - 但它可能完全取决于计算机体系结构，CLR版本等。

这是PLINQ错误吗？

1 个答案: