如何在c#中写入并行前缀和?

时间:2014-09-29 06:39:41

标签: c# parallel-processing prefix-sum

我想在c#中写一个并行前缀和。我用这个算法:

initial condition: list of n >= 1 elements stored in A[0...(n-1)]
final condition: each element A[i] contains A[0]+A[1]+...+A[i]
begin
  spawn (p1,p2,...,p(n-1))
  foe all pi where 1 <= i <= n-1 do
    for j←0 to ⌈logn⌉-1 do
      if i - 2^j >= 0 then
        A[i] ← A[i] + A[i - 2^j]
      end if
    end for
  end for
end

我在c#中的最终代码是:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using MPI;

namespace prefixsum3
{
    class Program
    {
        static void Main(string[] args)
        {
            int[] A = new int[] { 4, 3, 8, 2, 9, 1, 3, 5, 6, 3 };
            using (new MPI.Environment(ref args))
            {
                Intracommunicator comm = Communicator.world;
                int size, rank, n, i;
                size = comm.Size;
                i = comm.Rank + 1;
                n = A.Length;
                int[] B = new int[10];
                for (int j = 0; j <= (Math.Ceiling(Math.Log(n))) - 1; j++)
                {
                    int t = Convert.ToInt32(Math.Pow(2, j));
                    if ( i - t >= 0)
                    {
                        B[i] = A[i] + A[i - t];
                    }
                    comm.Barrier();
                    A[i] = B[i];
                    comm.Barrier();
                }
                if (comm.Rank == 0)
                {
                    for (int z = 0; z < n; z++)
                    {
                        Console.Write(A[z].ToString() + ",");
                    }
                }
            }
        }
    }
}

怀特输出应为:[4,7,15,17,26,27,30,35,41,44]
但我的输出代码是:[4,7,8,2,9,1,3,5,6,3]
是谁知道我的代码有什么问题?
编辑:
我发现每个处理器都在本地看到阵列A.现在的问题是如何在全局定义数组A,所有处理器都看到一个数组?

1 个答案:

答案 0 :(得分:0)

至于正确性,原算法中的对数是基数2,这是你的错误(或其中之一)。

关于效率,你没有正确理解双缓冲算法:你应该在B [i]中写入,同步,然后在下一次迭代之前交换A和B数组。你不需要两个障碍或A [i] = B [i]。但是,当t大于或等于i时,你必须做B [i] = A [i]。

最后Math.Pow是低效的,你最好从t = 1开始,然后在每次迭代时将它乘以2(t <&lt; = 1)。无论如何,你应该只使用更快的以下循环并修复前面提到的错误(你不再需要日志):

for (int t = 1; t < n; t <<= 1)