Graphx:是否可以在每个顶点上执行程序而不接收消息?

时间:2018-11-29 10:48:38

标签: scala apache-spark graph-theory spark-graphx spark-shell

当我尝试使用Scala在Graphx中实现算法时,我发现无法在下一个实例中激活所有顶点。如何向我的所有图形顶点发送消息? 在我的算法中,所有顶点都应执行一些超级步骤(无论是否接收到一条消息,因为即使没有接收到一条消息也应在下一次迭代中处理)。

我在这里给出了在pregel逻辑中实现的SSSP算法的正式代码,您可以看到只有接收到消息的顶点才能在下一次迭代中执行其程序,但是对于我而言,我希望pregel函数能够迭代运行,即每个超级执行顶点执行程序,如果需要,他们可以投票停止!该示例中的推理看起来与Pregel的书面逻辑不同。请问关于如何实现Pregel真正逻辑的任何想法?

val graph: Graph[Long, Double] =
  GraphGenerators.logNormalGraph(sc, numVertices = 100).mapEdges(e => e.attr.toDouble)
val sourceId: VertexId = 42 // The ultimate source
// Initialize the graph such that all vertices except the root have distance infinity.
val initialGraph = graph.mapVertices((id, _) =>
    if (id == sourceId) 0.0 else Double.PositiveInfinity)
val sssp = initialGraph.pregel(Double.PositiveInfinity)(
  (id, dist, newDist) => math.min(dist, newDist), // Vertex Program
  triplet => {  // Send Message
    if (triplet.srcAttr + triplet.attr < triplet.dstAttr) {
      Iterator((triplet.dstId, triplet.srcAttr + triplet.attr))
    } else {
      Iterator.empty
    }
  },
  (a, b) => math.min(a, b) // Merge Message
)
println(sssp.vertices.collect.mkString("\n"))

}

1 个答案:

答案 0 :(得分:4)

在阅读了@Mahmoud Hanafy和@Shaido的两份答复,确认没有办法激活顶点或停止GraphX中的表决后,我尝试在算法本身中实现此逻辑。所以,这就是我所做的:

  • Pregel的API在第一个超级步骤中向所有图形顶点发送v,在此它们可以在不活动之前至少执行一次例程。
  • 在此超级步骤结束时,每个顶点form.comments可能会向其邻居发送消息,并等待从其他顶点接收消息。
  • 在第二个超级步骤中,并非所有顶点都会从其邻居接收信息,这意味着在第二个超级步骤中,并非所有顶点都会被激活!因此,要解决此问题,我们需要返回到超级第一步,并确保每个顶点都会收到一条消息!怎么样?向自身发送消息! (这是我可以确保在下一步超级步骤中激活顶点的唯一方法,但是我认为这样做不是最好的方法,因为这会增加发送和接收的消息的数量。)
  • 在第二个超级步骤中,每个顶点将至少接收一条消息,因此将处于活动状态,因此可以执行其程序。
  • 为确保在接下来的超级步骤中激活顶点,我们可以这样做。

我再说一遍,这是我想出解决问题的唯一方法,但我不鼓励您使用它。