使用文件结构将多个模块推送到Dask集群

时间:2019-05-26 09:37:50

标签: dask

这几乎是对这个问题Push a pure-python module to Dask workers

的扩展

除了要尝试运行的代码分布在多个模块中(其中一些来自子目录)之外,我面临类似的挑战。为了使我的代码合理地井井有条,我有一个主要的“ code_runner”,它从“功能”文件夹中加载了不同的模块,以执行许多数据处理步骤。

我知道我可以将文件加载到Dask群集中,但是如何做到这一点,以便保持目录结构,并且导入仍然可以像“从功能导入Feature_1为f1”一样进行。 / p>

或者,如果我不正确地考虑了这一点,是否有更好的方法使用Dask来解决这个问题?

1 个答案:

答案 0 :(得分:0)

人们通常使用Docker,NFS,conda-pack或其他某种机制来部署更复杂的软件环境。 upload_file方法实际上是对整个环境的一个小补充。大型复杂软件环境的运输可能超出了Dask的范围。我们建议您使用任何用于移动软件的机制。