matrix_future = client.scatter(matrix, broadcast=True)
广播矩阵,并将matrix_future
传递给需要它的计算图中的延迟函数。这些功能在不同的节点上独立执行。提前致谢。
答案 0 :(得分:1)
数据将存在于每个dask工作进程中。每个节点上有10个副本。
Dask工作人员完全独立运作。他们不知道可能在同一节点上的其他工作人员。
相反,您可以考虑在每个具有十个线程的节点上创建一个dask worker。这通常是正确的选择,特别是如果您正在处理大型数字数据。