我正在尝试使用dask进行一些尴尬的并行处理。对于某些原因,我必须使用dask,但是使用multiprocessing.Pool(5).map
可以轻松完成任务。
例如:
import dask
from dask import compute, delayed
def do_something(x): return x * x
data = range(10)
delayed_values = [delayed(do_something)(x) for x in data]
results = compute(*delayed_values, scheduler='processes')
它可以工作,但是显然它只使用一个进程。
如何配置dask,以便它使用5个进程的池进行计算?