标签: java apache-spark
我有一个JavaPairRDD<Object, Object>分布在多个节点上,我想获得其中的JavaPairRDD<Object, List<Object>>而不会进行改组,因此只想分别减少每个节点上的映射,因此尝试避免groupbykey() 。最好的方法是什么?
JavaPairRDD<Object, Object>
JavaPairRDD<Object, List<Object>>
谢谢。