我需要将一个变量传递给dispy节点的setup()方法,这样我就可以告诉节点从配置文件加载哪个数据集。否则我必须为每个数据集编写一个特定的脚本,这将是痛苦的。
def setup(): # executed on each node before jobs are scheduled
# read data in file to global variable
global data
data = open('file.dat').read()
return 0
...
if __name__ == '__main__':
import dispy
cluster = dispy.JobCluster(compute, depends=['file.dat'], setup=setup, cleanup=cleanup)
所以我想将字符串"file.dat"
传递给设置,这样每个节点都可以实例化一次数据(因为它很大)。
答案 0 :(得分:3)
让我看看我是否理解这个问题。您希望将参数传递给设置,但setup
的实际调用发生在函数JobCluster
中的某处。那个电话不知道它应该传递一个论点。这是对的吗?
解决方案是使用标准库functools.partial
。你做这样的事情:
if __name__ == '__main__':
import dispy
f = functools.partial(setup,"file.dat")
cluster = dispy.JobCluster(compute, depends=['file.dat'], setup=f, cleanup=cleanup)
partial
返回的对象,在没有参数的情况下调用时,使用一个位置参数调用setup(" file.dat")。您必须重写设置来处理此参数,如下所示:
def setup(s): # executed on each node before jobs are scheduled
# read data in file to global variable
global data
data = open(s).read()
return 0