将边和顶点数组转换为图形格式化

时间:2016-02-14 23:03:11

标签: scala apache-spark spark-graphx

我已经在RDD中提取了维基百科页面之间的链接,其格式如下:

Array[(String, String)] = Array((AccessibleComputing,[Computer accessibility]), 
                      (Anarchism,[political philosophy, stateless society]))

第一个字符串是页面(Vertex),第二个字符串是指向其他Wiki页面的链接列表(边缘)。

如何将其转换为图形友好格式:

Array(
(AccessibleComputing,Computer accessibility),
(Anarchism,stateless society),
(Anarchism,political philosophy)
)

以便为每个顶点重复边缘

1 个答案:

答案 0 :(得分:0)

dropsplitflatMap

data.flatMap{case (k, v) => v.drop(1).dropRight(1).split(", ").map((k, _))}