GraphX:如何获取具有给定标签的所有边

时间:2014-10-14 18:30:12

标签: apache-spark

我有一个包含数百万条边的图,其中边由org.apache.spark.rdd.RDD[org.apache.spark.graphx.Edge[String]] = MappedRDD[4]表示。我有两个问题:

1)如何获取具有给定边缘标签的所有节点

2)是否可以在RDD或RDD的特定列上创建索引以使查找更快?

请原谅我这个问题的微不足道的问题,我是这个语言的新手,并且我花了一些时间来习惯它。

由于

1 个答案:

答案 0 :(得分:0)

1)你不能在rdd上找到.filter(_._ 2 ==“label”)?

2)我认为你所寻找的是IndexedRDD,但我认为你需要从最新来源重建火花