TITAN:将批量顶点和边缘上传到图表时,最佳提交频率是多少?

时间:2015-04-13 10:18:10

标签: graph-databases titan gremlin rexster

我使用的是TITAN-0.4.3,REXSTER 2.4而不是Cassandra& Elasticsearch。 我的用例需要一次将顶点和边缘批量上传到图表中。 现在我在添加每个顶点+边之后调用commit()。我按不同的提交频率运行一些测试,例如每10K,每1000和每100,并且上传速度变化很大。我想如何达到最佳提交频率,以及基于什么参数?

有关提高用例性能的建议吗? DB的大小约为10M顶点。

1 个答案:

答案 0 :(得分:1)

我不太确定我遇到过表示最佳提交频率的幻数。它似乎在很大程度上取决于数据加载策略。我倾向于从10000开始作为提交大小并从那里开始工作。不幸的是,到达这个数字通常比科学更多艺术。

然而,您可以通过缓存通常用于减少索引查找的顶点,预先排序数据以尝试将这些顶点保留在缓存中,在可能的情况下关闭锁定等来以其他方式加速加载。等等。阅读“10人权力”博客文章系列Part I可能会有所帮助,因为它可以解决图表大小的策略。