JavaPairRDD <对象,对象>到JavaPairRDD <对象,列表<对象>>,无需重新排列

时间:2019-09-08 22:13:27

标签: java apache-spark

我有一个JavaPairRDD<Object, Object>分布在多个节点上,我想获得其中的JavaPairRDD<Object, List<Object>>而不会进行改组,因此只想分别减少每个节点上的映射,因此尝试避免groupbykey() 。最好的方法是什么?

谢谢。

0 个答案:

没有答案