标签: python pandas high-availability distributed-system
我了解Dask [1]是使用python生态系统构建分布式数据管道的绝佳工具。尽管[1]说它可以很好地处理故障,但还不清楚Dask如何响应数据帧上发生的计算并且其中一个节点发生故障。它在集群的不同部分中是否具有DF的副本?如果是这样,我在文档中找不到任何描述。
[1] http://dask.pydata.org/en/latest/why.html