标签: apache-spark
为简单起见,用伪代码,如果我做myDF = spark.read.option('inferSchema', True).json(someFiles)然后我做myDF.count()会引起两次从磁盘读取数据吗?
myDF = spark.read.option('inferSchema', True).json(someFiles)
myDF.count()
答案 0 :(得分:0)