我第一次使用GraphX,我想逐步构建一个Graph。因此我需要将前两个节点连接到边缘,因为我知道我有2个RDD(每个节点都有一个值):
firstRDD: RDD[((Int, Array[Int]), ((VertexId, Array[Int]), Int))]
secondRDD: RDD[((Int, Array[Int]), ((VertexId, Array[Int]), Int))]
我想将第一个 VertexId 与第二个连接起来。 感谢您的帮助
答案 0 :(得分:0)
基本上,您使用map
和case
语句来挑选VertexIds,然后使用RDD.zip
将它们拼接在一起,然后使用另一个map
来创建最终的EdgeRDD :
firstRDD.map{
case ((junk1,junk2), ((vertex1, junk3), junk4)) => vertex1
}.zip(
secondRDD.map{
case ((junk1,junk2), ((vertex2, junk3), junk4)) => vertex2
}
).map{ case(vertex1, vertex2) => Edge(vertex1, vertex2, 0) }