我使用spark-sql进行数据迁移项目。 那么如何在Spark中实现舞台区域呢? 什么时候使用Spark sql缓存或持久化? 任何实时用例吗?
〜Sha
答案 0 :(得分:-1)
与RDD
(What is the difference between cache and persist?)类似,cache
和persist
之间的唯一区别是可以设置非默认存储模式。
但是有一个重要的区别。与RDD
API中cache
使用MEMORY_ONLY
,API Dataset
使用MEMORY_AND_DISK
的情况不同。