我可以在Azure Databricks笔记本的cosmos-db(图)上运行gremlin查询吗?

时间:2019-01-28 11:33:31

标签: apache-spark graph azure-cosmosdb gremlin azure-databricks

Gremlin是否可以直接集成到azure databricks笔记本中?

我在cosmosDb中有一个图形,我想运行一些gremlin查询,例如“ g.V()。hasLabel('x')。out('y')。out('z')”。我从azure protal运行查询,但是对于大量数据,它将抛出[“ Request rate is large”]

切换到Azure数据块,我创建了一个群集,添加了“ azure-cosmosdb-spark”库,并且从python笔记本中只能运行诸如“ SELECT * FROM c”之类的sql查询

我已经尝试过使用spark-gremlin和hadoop-gremlin库,但是我现在看到的唯一方法是将所有节点和边加载到dataFrame(按标签标记)中,然后将其更改为graphFrame和只有到那时,在这里重建图之后,我才能进行一些遍历查询,但还不能进行Gremlin查询。 (并且有数百万个节点和边缘,我不知道这对我有多大帮助)。

我想知道是否支持在cosmosDb上从笔记本进行直接gremlin查询,或者至少将图形直接迁移到dataFrame吗?

1 个答案:

答案 0 :(得分:0)

这看起来像您需要的:https://link.medium.com/zkaW4VIVQT

尽管这篇文章是关于写CosmosDB的,但我认为这些方法可以应用于阅读。