我已经创建了一个python程序来计算pi。然后我决定用mpi4py编写它来运行几个进程。该程序有效,但它返回的pi值与原始python版本不同。当我更多地研究这个问题时,我发现当我使用更多处理器运行它时,它会返回一个不太准确的值。为什么MPI版本会使用更多处理器来改变结果?使用广播而不是发送大量个人消息更有意义吗?如果它更有效,我将如何实施广播?
MPI版本:
#!/apps/moose/miniconda/bin/python
from mpi4py import MPI
comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()
name = MPI.Get_processor_name()
def f(x):
return (1-(float(x)**2))**float(0.5)
n = 1000000
nm = dict()
pi = dict()
for i in range(1,size+1):
if i == size:
nm[i] = (i*n/size)+1
else:
nm[i] = i*n/size
if rank == 0:
val = 0
for i in range(0,nm[1]):
val = val+f(float(i)/float(n))
val = val*2
pi[0] = (float(2)/n)*(float(1)+val)
print name, "rank", rank, "calculated", pi[0]
for i in range(1, size):
pi[i] = comm.recv(source=i, tag=i)
number = sum(pi.itervalues())
number = "%.20f" %(number)
import time
time.sleep(0.3)
print "Pi is approximately", number
for proc in range(1, size):
if proc == rank:
val = 0
for i in range(nm[proc]+1,nm[proc+1]):
val = val+f(float(i)/float(n))
val = val*2
pi[proc] = (float(2)/n)*(float(1)+val)
comm.send(pi[proc], dest=0, tag = proc)
print name, "rank", rank, "calculated", pi[proc]
原始Python版本:
#!/usr/bin/python
n = 1000000
def f(x):
return (1-(float(x)**2))**float(0.5)
val = 0
for i in range(n):
i = i+1
val = val+f(float(i)/float(n))
val = val*2
pi = (float(2)/n)*(float(1)+val)
print pi
答案 0 :(得分:2)
您的代码通过计算磁盘四分之一区域来估算,即使用梯形规则的的整数。
您的代码的问题是每个进程的i值范围都不完整。实际上,使用较小的n
并打印i
来查看正在发生的事情。例如,for i in range(nm[proc]+1,nm[proc+1]):
必须更改为for i in range(nm[proc],nm[proc+1]):
。否则,永远不会处理i = nm [proc]。
此外,在pi[0] = (float(2)/n)*(float(1)+val)
和pi[proc] = (float(2)/n)*(float(1)+val)
中,术语float(1)
来自积分中的x = 0。但它被计数多次,每次进程一次!由于错误数量与进程数量直接相关,因此增加进程数会降低准确性,这是您报告的症状。
广播对应于通信器的所有进程必须从给定进程获得相同数据的情况。相反,这里要求必须使用总和来组合来自所有处理器的数据,以产生可用于单个进程的结果(称为" root")。后一种操作称为减少,由comm.Reduce()
执行。
以下是使用comm.Reduce()
代替send()
和recv()
的基于您的代码。
from mpi4py import MPI
import numpy as np
comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()
name = MPI.Get_processor_name()
def f(x):
return (1-(float(x)**2))**float(0.5)
n = 10000000
nm =np.zeros(size+1,'i')
nm[0]=1
for i in range(1,size+1):
if i == size:
nm[i]=n
else:
nm[i] = (i*n)/size
val=0
for i in range(nm[rank],nm[rank+1]):
val = val+f((float(i))/float(n))
out=np.array(0.0, 'd')
vala=np.array(val, 'd')
comm.Reduce([vala,MPI.DOUBLE],[out,MPI.DOUBLE],op=MPI.SUM,root=0)
if rank == 0:
number =(float(4)/n)*(out)+float(2)/n
number = "%.20f" %(number)
import time
time.sleep(0.3)
print "Pi is approximately", number