Java相当于Spark的Join操作

时间:2016-09-06 20:46:01

标签: java dictionary join apache-spark collections

因为Apache Spark提供了一种方便的方式来加入pair RDDs

JavaPairRDD<K,scala.Tuple2<V,W>> join(JavaPairRDD<K,W> other)

我想知道在vanilla Java中是否有类似的东西?

e.g。两张地图

Map<K, V>, Map<K, V>

产生

Map<K, Set<V>>

提前致谢。

2 个答案:

答案 0 :(得分:0)

没有。

你必须创建一个新的地图并以某种方式遍历键/值(你可以用漂亮的新流api来完成)。

或者看看番石榴的多图。

答案 1 :(得分:-1)

我认为你可以使用leftOuterJoin()

JavaPairRdd<K,V> left;
JavaPairRdd<K,V> right;

JavaPairRdd<K, Tuple2<V, Optional<V>>> joined = left.leftOuterJoin(right);