我们有314m的记录被添加到Titan。使用DynamoDB表作为后端使用Amazon Titan,我们意识到大约10%的数据位于125个中的一个分区上。
这种不均匀分布会导致写入和读取操作出现问题。这种分布不均的原因是什么?我们正在使用单项模型,这是问题的原因吗?
答案 0 :(得分:0)
数据分布不均是由于DynamoDB中相同分区键的聚类造成的。由于分区键对应于Titan中的out-vertex id,如果在一个顶点上有很多属性,或者如果你有很多边从顶点出来(超级节点),你应该尝试加载你的图形,并在其上启用顶点分区顶点标签。在TitanManagement中创建顶点标签时,您需要做的就是在提交TitanManagement操作之前调用.partition()。如果DynamoDB表有125个分区,则需要大约256个最大分区,以保证数据均匀分布在物理分区周围。