Titan DB Aggregations

时间:2016-04-05 07:37:41

标签: hbase graph-databases titan

我想使用Titan Db(存储后端:HBase)在我们维护的图形数据上执行聚合。我们的目标是在Titan DB中以图形的形式存储我们的数据仓库数据。但是,聚合需要花费很多时间,我正在使用一个titan实例。 遵循的步骤: 1.创建图形-4.5lac顶点,4个lac边缘。 2.创建索引-vertex&边缘。 3.启用数据库缓存。

当我遍历深度为4的图形以查找总和以查找属性上大约8000个顶点的总和时,我看到第一次需要大约30秒来响应查询。后续查询直到3分钟(数据库缓存刷新为3英寸),服务时间不到一秒。但是再过3分钟后,重建缓存并提供响应需要30秒。 有没有人有类似的用例和任何关于我如何使titan表现更快聚合的建议?我期待泰坦的实时表现。

1 个答案:

答案 0 :(得分:1)

你可能已经知道了这一点,但我会发布我们所做的事情,以便从Titan获得一些性能提升。此处的列表全部基于Titan Docs的this章节。

  1. 复合指数 - 你可能有这些,但值得一提,因为它们大大加快了对某些顶点的直接查找。
  2. 顶点中心指数 - 如果您有超级节点,这些可以非常快速地消除您不需要遍历的边缘。
  3. 混合索引 - 这些适用于任何需要数值范围或排序的操作,而Elasticsearch是一个非常强大的索引工具。
  4. 如果问题不是阅读而是写作,您也可以尝试bulk loading