GraphFrames:按关系汇总顶点

时间:2018-11-17 20:56:09

标签: java apache-spark graphframes

这个周末我将使用GraphFrames进行测试,我需要有关聚合请求的帮助。我的GraphFrame是使用以下数据构建的。本质上,我需要遵循使用特定关系的顶点并将其聚合为列表。因此,基本上我需要将我的图聚合到“ group1”:[a,b,c,d]和“ group2”:[d,e](因为这两个组不共享任何关系)。

从我的阅读看来, AggregateMessages 是完成这项工作的工具,但我不知道如何将其组合在一起。

问题1::由于节点是字符串类型,我该如何聚合它们。

  

gFrame.edges()。groupBy(“ relation”)。sum(“ src”)。show();

问题2:如果将边缘按照“跟随”关系分组,则将所有节点归为一个组。如何仅按“已连接”的顶点分组。

这是我的数据:

Vertex:
{name: a}
{name: b}
{name: c}
{name: d}
{name: e}

Edges:
{src: a, dest: b: relation: follow}
{src: c, dest: b: relation: follow}
{src: c, dest: a: relation: follow}
{src: d, dest: e: relation: follow}

谢谢!

0 个答案:

没有答案