重用缓存的Spark RDD

时间:2017-01-18 14:26:32

标签: caching apache-spark rdd

Spark是否有可能在另一个应用程序(或同一应用程序的另一个运行)中重用缓存的RDD?

JavaRDD<ExampleClass> toCache = ... // transformations on the RDD
toCache.cache();                    // can this be reused somehow in another application or further runs?

1 个答案:

答案 0 :(得分:2)

不,Spark RDD不能用于其他应用程序或其他运行。

您可以将Spark与例如HazelcastApache Ignite连接,以将RDD保存在内存中。其他应用程序将有可能读取第一个应用程序中保存的数据