Spark:如何附加到缓存的rdd?

时间:2015-12-03 23:02:04

标签: caching apache-spark spark-streaming

  • 每个流式数据批量都会缓存不同的值。
  • 如何通过将下一批次中的下一个不同值添加到已缓存的RDD来构建缓存?

1 个答案:

答案 0 :(得分:0)

您无法使用Rdd直接附加数据,因为它是不可变的。使用union创建新的Rdd然后缓存它。