应用错误收集

Amazon Titan：数据在DynamoDB分区上分布不均

时间：2016-07-20 18:13:54

标签： amazon-dynamodb titan

我们有314m的记录被添加到Titan。使用DynamoDB表作为后端使用Amazon Titan，我们意识到大约10％的数据位于125个中的一个分区上。

这种不均匀分布会导致写入和读取操作出现问题。这种分布不均的原因是什么？我们正在使用单项模型，这是问题的原因吗？

1 个答案:

答案 0 :(得分：0)

数据分布不均是由于DynamoDB中相同分区键的聚类造成的。由于分区键对应于Titan中的out-vertex id，如果在一个顶点上有很多属性，或者如果你有很多边从顶点出来（超级节点），你应该尝试加载你的图形，并在其上启用顶点分区顶点标签。在TitanManagement中创建顶点标签时，您需要做的就是在提交TitanManagement操作之前调用.partition（）。如果DynamoDB表有125个分区，则需要大约256个最大分区，以保证数据均匀分布在物理分区周围。