AttributeError:模块“ dask”没有属性“ delayed”

时间:2019-12-04 16:58:36

标签: dask dask-delayed

使用Pycharm社区2018.1.4
Python 3.6
达斯2.8.1

尝试在某些方法上延迟执行dask并收到错误消息

AttributeError: module 'dask' has no attribute 'delayed'.

这显然不是真的,所以我想知道自己在做错什么。我的实现结构如下:

import dask
def main()
  for i, fn in enumarate(filenames):
     data = {}
     for x in range(0,2):
         data.update(dask.delayed(load_data)(fn, x))
         succes_flag = dask.delayed(execute_analytic)(data)

         if success_flag == 1:
            print("success")
         else:
            print("fail")

def load_data(filename,selector):

def execute_analytic(data)

if __name__ == '__main__':
    dask.compute(main())

本质上,我有一堆彼此独立的数据文件,因此我想并行运行它们,而不是依次通过for循环运行,如果您把dask.delayed取出,我会这样做。 br /> 从上面的dask延迟实现中,我是否根本上缺少任何东西?

3 个答案:

答案 0 :(得分:2)

我引用了以下URL https://github.com/dask/dask/issues/1849

要使用点子安装Dask,有几个选项,具体取决于哪个 您想保持最新状态的依赖关系:

  • pip install dask [complete]:安装所有内容
  • pip install dask [array]:安装dask和numpy
  • pip install dask [bag]:安装dask和cloudpickle
  • pip install dask [dataframe]:安装dask,numpy和pandas
  • pip install dask:仅安装dask,这仅取决于标准 图书馆。如果只需要任务计划程序,则此方法很合适。

答案 1 :(得分:1)

您可能只安装了核心库,而没有安装具有正常依赖性的完整库。

conda install dask
or
pip install dask[complete]

有关更多信息,请参见https://docs.dask.org/en/latest/install.html

答案 2 :(得分:0)

pip install "dask[delayed]" 是直接回答 OP 的最低要求(其他答案可能会安装不必要的依赖项)