我们将使用Oracle大数据空间和图形。我们需要使用PGQL查询分布式图。 (对于我们来说,使用PGX的默认/给定算法是不够的。)图表将使用下面的HBase。
问题是PGQL仅适用于CDH群集的单个节点。您可以一次查询单个节点,但不能使用群集的整个内存。我们需要一种方法来查询所有节点,然后聚合(组合)来自节点的结果并将其提供给用户。
Presto有什么方法可以帮助我们解决这个问题?
答案 0 :(得分:1)
此时PGQL不在PGX Distributed Engine(PGX.D)中运行。支持PGX.D中的PGQL在我们的路线图上。
目前,如果需要跨群集运行分布式查询,一种方法是使用Oracle大数据空间和图形支持的Spark集成。
以下开发指南的第5部分可能会有所帮助。 http://docs.oracle.com/cd/E86005_01/BDSPA/using-property-graphs-big-data.htm#BDSPA-GUID-EFECEBBB-6BD6-4A63-B962-DB5AD7EB4C03
关于Presto,它似乎可以消耗Hive(和其他一些数据源)中的数据。所以从理论上讲,你可以在Hive中定义一个位于HBase中存储的图形数据之上的视图(外部表),然后运行Presto。这个流程需要经过验证和测试。