使用顶点属性将CSV加载到GraphX中

时间:2016-07-22 10:36:01

标签: csv spark-graphx

我是GraphX的新手,我尝试将CS​​V文件作为图表加载。 CSV的格式为:

ID1      ID2      Attr1     Attr2      OtherAttr1      OtherAttr2
0        6        -2        4          soccer          basketball
3        1        5         -3         coke            software
1        0        -3        -2         software        soccer
.
.
.

前两列表示顶点的ID,链接位于第一列(ID1)和第二列(ID2)之间。 Attr1OtherAttr1是顶点1(ID1)的属性,Attr2OtherAttr2是顶点2(ID2)的属性。

所以,在我的图表中,我有0指向6,其中0表示属性-2和足球,6表示属性4和篮球。然后3点朝向1,依此类推。

另请注意,属性与顶点一致,因此即使ID为1的顶点出现两次,其属性在两行中也是一致的。

请帮助我,如果有更好的方法让桌子本身更容易,那么请告诉我!

0 个答案:

没有答案