没有持久性或缓存性,Spark在每次操作时都不会从磁盘读取数据吗?

时间:2019-02-11 23:47:16

标签: apache-spark

为简单起见,用伪代码,如果我做myDF = spark.read.option('inferSchema', True).json(someFiles)然后我做myDF.count()会引起两次从磁盘读取数据吗?

1 个答案:

答案 0 :(得分:0)