标签: apache-spark
我有一个包含数百万条边的图,其中边由org.apache.spark.rdd.RDD[org.apache.spark.graphx.Edge[String]] = MappedRDD[4]表示。我有两个问题:
org.apache.spark.rdd.RDD[org.apache.spark.graphx.Edge[String]] = MappedRDD[4]
1)如何获取具有给定边缘标签的所有节点
2)是否可以在RDD或RDD的特定列上创建索引以使查找更快?
请原谅我这个问题的微不足道的问题,我是这个语言的新手,并且我花了一些时间来习惯它。
由于
答案 0 :(得分:0)
1)你不能在rdd上找到.filter(_._ 2 ==“label”)?
2)我认为你所寻找的是IndexedRDD,但我认为你需要从最新来源重建火花