TITAN:识别并删除图中的重复顶点

时间:2015-05-08 07:38:06

标签: graph graph-databases titan gremlin

我在Cassandra上使用TITAN 0.4,我已经为我的密钥编译了索引(在我的情况下为“ip_address”),但是为了性能和可伸缩性,它是非常独特的。 现在挑战是图表允许重复顶点。 我正在运行一个后台任务,通过迭代所有顶点来清理图中的重复顶点。 在图中识别重复顶点的最佳方法或方法是什么。 生产中图形的估计大小约为10M~15M顶点,甚至更大。 TITAN索引中是否存在任何功能,这有助于轻松识别重复? 提前致谢

索引创建Gremlin脚本

g.makeKey("ip_address").dataType(String.class).indexed("standard",Vertex.class).make();

0 个答案:

没有答案