有没有办法将变量传递给dispy中的setup()?

时间:2015-07-07 01:11:33

标签: python parallel-processing dispy

我需要将一个变量传递给dispy节点的setup()方法,这样我就可以告诉节点从配置文件加载哪个数据集。否则我必须为每个数据集编写一个特定的脚本,这将是痛苦的。

def setup(): # executed on each node before jobs are scheduled
    # read data in file to global variable
    global data
    data = open('file.dat').read()
    return 0
...
if __name__ == '__main__':
    import dispy
    cluster = dispy.JobCluster(compute, depends=['file.dat'], setup=setup, cleanup=cleanup)

所以我想将字符串"file.dat"传递给设置,这样每个节点都可以实例化一次数据(因为它很大)。

1 个答案:

答案 0 :(得分:3)

让我看看我是否理解这个问题。您希望将参数传递给设置,但setup的实际调用发生在函数JobCluster中的某处。那个电话不知道它应该传递一个论点。这是对的吗?

解决方案是使用标准库functools.partial。你做这样的事情:

if __name__ == '__main__':
    import dispy
    f = functools.partial(setup,"file.dat")
    cluster = dispy.JobCluster(compute, depends=['file.dat'], setup=f, cleanup=cleanup)

partial返回的对象,在没有参数的情况下调用时,使用一个位置参数调用setup(" file.dat")。您必须重写设置来处理此参数,如下所示:

def setup(s): # executed on each node before jobs are scheduled
    # read data in file to global variable
    global data
    data = open(s).read()
    return 0