Amazon Titan:数据在DynamoDB分区上分布不均

时间:2016-07-20 18:13:54

标签: amazon-dynamodb titan

我们有314m的记录被添加到Titan。使用DynamoDB表作为后端使用Amazon Titan,我们意识到大约10%的数据位于125个中的一个分区上。

这种不均匀分布会导致写入和读取操作出现问题。这种分布不均的原因是什么?我们正在使用单项模型,这是问题的原因吗?

1 个答案:

答案 0 :(得分:0)

数据分布不均是由于DynamoDB中相同分区键的聚类造成的。由于分区键对应于Titan中的out-vertex id,如果在一个顶点上有很多属性,或者如果你有很多边从顶点出来(超级节点),你应该尝试加载你的图形,并在其上启用顶点分区顶点标签。在TitanManagement中创建顶点标签时,您需要做的就是在提交TitanManagement操作之前调用.partition()。如果DynamoDB表有125个分区,则需要大约256个最大分区,以保证数据均匀分布在物理分区周围。