在应用程序崩溃的情况下使用RDD.checkpoint恢复rdd

时间:2016-07-24 07:54:23

标签: apache-spark

我正在编写一个具有多次迭代的Spark(不是Streaming)应用程序。我想在每个第N次迭代检查我的rdd,这样如果我的应用程序崩溃,我可以从最后一个检查点重新运行它。我在这个用例中找到的所有引用似乎都适用于Spark Streaming应用程序,其中整个程序的完整检查点可以通过一个应用程序运行轻松保存,然后由另一个应用程序读取(getOrCreate)。

如何在常规Spark中读取检查点rdd?

0 个答案:

没有答案