在Apache Giraph中导入/保存SNAP Facebook边缘

时间:2015-05-08 13:07:41

标签: facebook data-import giraph

我正在使用SNAP facebook数据集进行社交网络分析。 SNAP使用简单边缘列表作为数据格式“node1 node2”。如何在Apache Giraph中读取SNAP数据集?我正在读取每行BufferedReader行的文件,但不知道如何将其保存在带有邻接列表的BSP模型中。有人可以帮助我使用java中的代码示例吗? 我还想添加有关节点的信息(每个用户/节点的特性)我怎么能在Giraph中做到这一点?

1 个答案:

答案 0 :(得分:0)

您可以直接使用SNAP facebook数据集。在您的命令中,而不是使用-vif ...使用-eif org.apache.giraph.io.formats.IntNullTextEdgeInputFormat。此格式将每行读取为(source_vertex destination_vertex),就像SNAP数据集一样。