标签: apache-spark
我正在编写一个具有多次迭代的Spark(不是Streaming)应用程序。我想在每个第N次迭代检查我的rdd,这样如果我的应用程序崩溃,我可以从最后一个检查点重新运行它。我在这个用例中找到的所有引用似乎都适用于Spark Streaming应用程序,其中整个程序的完整检查点可以通过一个应用程序运行轻松保存,然后由另一个应用程序读取(getOrCreate)。
如何在常规Spark中读取检查点rdd?