dask-如何将本地分布式调度程序设置为dask.dataframe的默认调度程序?

时间:2020-03-11 23:38:08

标签: dask dask-distributed

我试图使dask.dataframe在默认情况下使用本地分布式调度程序,但是从阅读Dask文档中如何做到这一点上我还不清楚。像下面这样满足吗?

from dask import distributed
from dask import dataframe as dd
client = distributed.Client(processes=True)  # use multi processing
dask.config.set(scheduler=client)

dd.merge(df1, df2, on='some_col')

1 个答案:

答案 0 :(得分:0)

是的:如果创建任何种类的分布式Client,它将成为进一步进行Dask计算的默认调度程序。