标签: java apache-spark
首先,我使用SparkSQL读取200万行的表,然后将其缓存(数据集)。 其次,做
JavaRDD javaRDD = dataset.javaRDD().cache();