Janusgraph查询返回数据框以使用GraphFrame执行分析

时间:2018-08-03 07:33:52

标签: python-2.7 apache-spark apache-spark-sql gremlin janusgraph

我使用JanusGraph,HBase和Python(通过gremlin_python)来创建和存储示例图。现在,我想进行一些图形分析(例如页面排名),并希望坚持使用Python。我想知道是否有可能以DataFrame格式从JanusGraph查询图表,然后将其摄取到GraphFrame中以计算pageRank吗?

关键问题是如何使用Python在JanusGraph + GraphFrame之间建立桥梁,即 1.查询以一种格式返回的图 2.调用GraphFrame API计算PageRank。

1 个答案:

答案 0 :(得分:0)

就我而言,尚无官方连接器可用于将JanusGraph的查询结果转换为Spark DataFrame(然后转换为GraphFrame中的Graph)。

因此,您必须手动编写代码以执行转换。您可以使用gremlin-python包查询JanusGraph,然后使用Spark将结果集输入Spark DataFrame