如何在GraphX中创建二分图

时间:2015-10-20 15:57:40

标签: graph apache-spark bipartite

我可以通过GraphX API使用vertexRDDedgeRDD构建图表,没问题。即:

val graph: Graph[(String, Int), Int] = Graph(vertexRDD, edgeRDD)

但是,如果我想使用两个单独的顶点RDD而不是一个(二分图),我不知道从哪里开始。例如,包含购物者和产品顶点的图表。

我的问题很广泛,所以我不期待一个详细的例子,而是在正确的方向上提示或推动。任何建议都会非常感激。

1 个答案:

答案 0 :(得分:3)

例如,要将用户和产品建模为二分图,我们可能会执行以下操作:

trait VertexProperty
case class UserProperty(val name: String) extends VertexProperty
case class ProductProperty(val name: String,
  val price: Double) extends VertexProperty

val users: RDD[(VertexId, VertexProperty)] = sc.parallelize(Seq(
  (1L, UserProperty("user1")), (2L, UserProperty("user2"))))

val products: RDD[(VertexId, VertexProperty)] = sc.parallelize(Seq(
  (1001L, ProductProperty("foo", 1.00)), (1002L, ProductProperty("bar", 3.99))))

val vertices = VertexRDD(users ++ products)

// The graph might then have the type:
val graph: Graph[VertexProperty, String] = null