在单台OSX计算机上运行Dask-默认情况下是否并行?

时间:2019-03-13 01:30:48

标签: python dask dask-distributed

我已经在OSX Mojave上安装了Dask。默认情况下,它是否并行执行计算?还是我需要更改某些设置?

我正在使用DataFrame API。这对答案有影响吗?

我用pip安装了它。这对答案有影响吗?

1 个答案:

答案 0 :(得分:1)

是的,默认情况下,Dask是并行的。

除非另行指定,否则创建一个分布式Client,否则将使用“线程”调度程序在与内核数相同的线程数下执行。但是请注意,由于存在python GIL(一次仅执行一条python指令),您可能无法获得尽可能多的并行性,具体取决于您在释放GIL方面的特定任务。这就是为什么您可以选择调度程序的原因。

在OSX上,通过pip安装:这些没有区别。使用数据框会有所不同,因为它决定了您可能正在运行的任务的种类。熊猫擅长于发布许多操作的GIL。