我使用dask定义了很长的计算流程;在给定的api和版本约束下,在某些时候,我需要计算一些小的结果(不是惰性的)并将其提供给惰性操作。我的问题是,此时将执行整个计算图,以便产生中间结果。在下一步将最终结果存储到磁盘时,是否有一种方法可以不松开此时所做的工作,而必须重新计算所有内容?
是否正在使用persist
来解决这个问题?
任何帮助将不胜感激。
答案 0 :(得分:0)
是的,这是persist
用于的用例。诀窍是弄清楚在哪里应用它-该决定通常受以下因素影响:
foo
中的foo = intermediate.persist()
)。.visualize()
查看图表。