标签: apache-spark spark-graphx
我想控制GraphX中属性图的分区的放置。据我了解,为了指定RDD分区的首选位置,将需要创建一个覆盖getPreferredLocations()函数的子类。例如,ParallelCollectionRDD会覆盖该方法以考虑首选项。
getPreferredLocations()
但是,GraphX中的属性图是多个RDD的组合。如何提供首选位置?我是否需要使用EdgeRDD函数实现自定义getPreferredLocations()?由于似乎VertexRDD是根据边缘分区进行分区的。我还需要实现其他功能吗?
EdgeRDD