从Cassandra迁移到Cosmos后,为什么数据大小会增加?

时间:2019-01-19 04:25:55

标签: azure cassandra azure-storage azure-cosmosdb

我们成功地将大约3 GB的数据从Cassandra迁移到了Cosmos。并且观察到的数据量增加了约5倍(相同的数据;尚未添加其他行)

虽然我听到别人说这是预期的,

  1. 为什么相同数据的数据大小会增加?卡桑德拉(Cassandra)对相同的数据保持低调,但Cosmos夸大了它。
  2. 是否有任何工具可以验证所有数据是否已成功迁移?

1 个答案:

答案 0 :(得分:1)

随着需求的增长,Azure Cosmos DB可以自动扩展存储和吞吐量。您可以使用Azure Cosmos DB request unit calculator来估计吞吐量需求,如果使用此计划程序,则应该可以使您对将要使用的数据存储的比率有所了解。

另一个因素是使用: Horizontal Partitioning/Scaling ,这可能是导致数据大小增加的主要因素。我建议重新分区(文档也包含有关如何进行分区的链接。)。要监视是否是原因,可以使用 monitoring of your partitions

要确定按分区细分的任何分区容器的存储分布,请转至Azure门户中的“指标”刀片。在“存储”标签中,存储细分显示在顶部分区键消耗的“数据+索引”存储图表中。

如有任何其他问题,请随时与Cosmos DB团队联系:askcosmosdb [at] microsoft.com