标签: apache-spark rdd
Spark rdd联接基于reduceByKey,该密钥按键随机排列。 Spark sql连接可以基于排序合并连接。如何使Spark rdd联接像排序合并联接一样?
reduceByKey