如何确定何时使用Spark sql缓存或持久化?

时间:2018-10-12 09:35:03

标签: apache-spark apache-spark-sql

我使用spark-sql进行数据迁移项目。 那么如何在Spark中实现舞台区域呢? 什么时候使用Spark sql缓存或持久化? 任何实时用例吗?

〜Sha

1 个答案:

答案 0 :(得分:-1)

RDDWhat is the difference between cache and persist?)类似,cachepersist之间的唯一区别是可以设置非默认存储模式。

但是有一个重要的区别。与RDD API中cache使用MEMORY_ONLY,API Dataset使用MEMORY_AND_DISK的情况不同。