使用Pycharm社区2018.1.4
Python 3.6
达斯2.8.1
尝试在某些方法上延迟执行dask并收到错误消息
AttributeError: module 'dask' has no attribute 'delayed'.
这显然不是真的,所以我想知道自己在做错什么。我的实现结构如下:
import dask
def main()
for i, fn in enumarate(filenames):
data = {}
for x in range(0,2):
data.update(dask.delayed(load_data)(fn, x))
succes_flag = dask.delayed(execute_analytic)(data)
if success_flag == 1:
print("success")
else:
print("fail")
def load_data(filename,selector):
def execute_analytic(data)
if __name__ == '__main__':
dask.compute(main())
本质上,我有一堆彼此独立的数据文件,因此我想并行运行它们,而不是依次通过for循环运行,如果您把dask.delayed取出,我会这样做。 br /> 从上面的dask延迟实现中,我是否根本上缺少任何东西?
答案 0 :(得分:2)
我引用了以下URL https://github.com/dask/dask/issues/1849
要使用点子安装Dask,有几个选项,具体取决于哪个 您想保持最新状态的依赖关系:
答案 1 :(得分:1)
您可能只安装了核心库,而没有安装具有正常依赖性的完整库。
conda install dask
or
pip install dask[complete]
答案 2 :(得分:0)
pip install "dask[delayed]"
是直接回答 OP 的最低要求(其他答案可能会安装不必要的依赖项)