我已经在OSX Mojave上安装了Dask。默认情况下,它是否并行执行计算?还是我需要更改某些设置?
我正在使用DataFrame API。这对答案有影响吗?
我用pip安装了它。这对答案有影响吗?
答案 0 :(得分:1)
是的,默认情况下,Dask是并行的。
除非另行指定,否则创建一个分布式Client
,否则将使用“线程”调度程序在与内核数相同的线程数下执行。但是请注意,由于存在python GIL(一次仅执行一条python指令),您可能无法获得尽可能多的并行性,具体取决于您在释放GIL方面的特定任务。这就是为什么您可以选择调度程序的原因。
在OSX上,通过pip安装:这些没有区别。使用数据框会有所不同,因为它决定了您可能正在运行的任务的种类。熊猫擅长于发布许多操作的GIL。