如何在Spark Graphx Scala中的图形中为顶点(已有属性)添加额外的属性?

时间:2015-09-08 14:39:29

标签: scala twitter graph apache-spark spark-graphx

情况:

我在Spark(scala)中构建了一个基于某些tweeter数据的图形,如下所示:

  • 每个顶点都有一个推文id(Long)和推文正文(String)
  • 每条边将源推文连接到转发

我做的方法是从边缘文件创建一个图形:

val followerGraph = GraphLoader.edgeListFile(sc, "C:\\Users\\...\\tweetGraphEdgesData.txt")

然后使用outerJoinVertices

将属性添加到每个顶点
   val graph = followerGraph.outerJoinVertices(verticesData){
    case(uid,deg,Some(attrList))=>attrList
    case(uid,deg,None)=> Array.empty[String]
   }

问题:

  

现在我想将每个顶点所连接的边数附加到每个顶点(这基本上意味着重新推文的次数)。我怎么能这样做?

0 个答案:

没有答案