如何使用散点函发送部分数组?

时间:2012-10-10 05:20:46

标签: python mpi

我正在教自己的Python mpi4py模块,用于在多个进程中进行编程。我编写了以下代码来练习分散。

from mpi4py import MPI

comm = MPI.COMM_WORLD
size = comm.Get_size()
rank = comm.Get_rank()

if rank == 0:
   data = [i for i in range(8)]
else:
   data = None
data = comm.scatter(data, root=0)
print str(rank) + ': ' + str(data)

使用8个进程运行上面的代码非常有用。但是,当我用4个进程运行它时,我收到一个错误:

Traceback (most recent call last):
  File "scatter.py", line 11, in <module>
    data = comm.scatter(data, root=0)
  File "Comm.pyx", line 874, in mpi4py.MPI.Comm.scatter (src/mpi4py.MPI.c:68023)
  File "pickled.pxi", line 656, in mpi4py.MPI.PyMPI_scatter (src/mpi4py.MPI.c:32402)
  File "pickled.pxi", line 127, in mpi4py.MPI._p_Pickle.dumpv (src/mpi4py.MPI.c:26813)
ValueError: expecting 4 items, got 8

这个错误是什么意思?我的目的是将我的大量8个项目分解成8/4 = 2项的小数组,并将每个进程发送一个这样的子数组。我怎么做?如果可能的话,我还想概括一些不能均匀分配到8的过程,例如3。

1 个答案:

答案 0 :(得分:9)

似乎comm.scatter无法将count作为参数,并且期望精确comm.size个元素的列表作为数据分散;所以你需要自己在进程之间分配数据。这样的事情会做:

if rank == 0:
    data = [i for i in range(8)]
# dividing data into chunks
    chunks = [[] for _ in range(size)]
    for i, chunk in enumerate(data):
        chunks[i % size].append(chunk)
else:
    data = None
    chunks = None
data = comm.scatter(chunks, root=0)
print str(rank) + ': ' + str(data)

[physics@tornado] ~/utils> mpirun -np 3 ./mpi.py 
2: [2, 5]
0: [0, 3, 6]
1: [1, 4, 7]

希望这有帮助。