Question

我已经创建了一个python程序来计算pi。然后我决定用mpi4py编写它来运行几个进程。该程序有效，但它返回的pi值与原始python版本不同。当我更多地研究这个问题时，我发现当我使用更多处理器运行它时，它会返回一个不太准确的值。为什么MPI版本会使用更多处理器来改变结果？使用广播而不是发送大量个人消息更有意义吗？如果它更有效，我将如何实施广播？

MPI版本：

#!/apps/moose/miniconda/bin/python
from mpi4py import MPI
comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()
name = MPI.Get_processor_name()
def f(x):
    return (1-(float(x)**2))**float(0.5)
n = 1000000
nm = dict()
pi = dict()
for i in range(1,size+1):
    if i == size:
        nm[i] = (i*n/size)+1
    else:
        nm[i] = i*n/size
if rank == 0:
    val = 0
    for i in range(0,nm[1]):
        val = val+f(float(i)/float(n))
    val = val*2
    pi[0] = (float(2)/n)*(float(1)+val)
    print name, "rank", rank, "calculated", pi[0]
    for i in range(1, size):
        pi[i] = comm.recv(source=i, tag=i)
    number = sum(pi.itervalues())
    number = "%.20f" %(number)
    import time
    time.sleep(0.3)
    print "Pi is approximately", number
for proc in range(1, size):
    if proc == rank:
        val = 0
        for i in range(nm[proc]+1,nm[proc+1]):
            val = val+f(float(i)/float(n))
        val = val*2
        pi[proc] = (float(2)/n)*(float(1)+val)
        comm.send(pi[proc], dest=0, tag = proc)
        print name, "rank", rank, "calculated", pi[proc]

原始Python版本：

#!/usr/bin/python
n = 1000000
def f(x):
    return (1-(float(x)**2))**float(0.5)
val = 0
for i in range(n):
    i = i+1
    val = val+f(float(i)/float(n))
val = val*2
pi = (float(2)/n)*(float(1)+val)
print pi

Answer 1

您的代码通过计算磁盘四分之一区域来估算 $\pi$ ，即使用梯形规则的 $\sqrt{1-x^2}$ 的整数。

您的代码的问题是每个进程的i值范围都不完整。实际上，使用较小的n并打印i来查看正在发生的事情。例如，for i in range(nm[proc]+1,nm[proc+1]):必须更改为for i in range(nm[proc],nm[proc+1]):。否则，永远不会处理i = nm [proc]。此外，在pi[0] = (float(2)/n)*(float(1)+val)和pi[proc] = (float(2)/n)*(float(1)+val)中，术语float(1)来自积分中的x = 0。但它被计数多次，每次进程一次！由于错误数量与进程数量直接相关，因此增加进程数会降低准确性，这是您报告的症状。

广播对应于通信器的所有进程必须从给定进程获得相同数据的情况。相反，这里要求必须使用总和来组合来自所有处理器的数据，以产生可用于单个进程的结果（称为＆＃34; root＆＃34;）。后一种操作称为减少，由comm.Reduce()执行。

以下是使用comm.Reduce()代替send()和recv()的基于您的代码。

from mpi4py import MPI
import numpy as np

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()
name = MPI.Get_processor_name()
def f(x):
    return (1-(float(x)**2))**float(0.5)

n = 10000000
nm =np.zeros(size+1,'i')

nm[0]=1
for i in range(1,size+1):
    if i == size:
        nm[i]=n
    else:
        nm[i] = (i*n)/size

val=0
for i in range(nm[rank],nm[rank+1]):
    val = val+f((float(i))/float(n))

out=np.array(0.0, 'd')
vala=np.array(val, 'd')
comm.Reduce([vala,MPI.DOUBLE],[out,MPI.DOUBLE],op=MPI.SUM,root=0)
if rank == 0:
    number =(float(4)/n)*(out)+float(2)/n
    number = "%.20f" %(number)
    import time
    time.sleep(0.3)
    print "Pi is approximately", number

MPI处理器数量创建错误，如何实现广播？

1 个答案: