如何估算BigTable存储利用率?

时间:2018-10-12 05:50:18

标签: google-cloud-platform google-cloud-bigtable

如何估算BigTable表实际使用多少空间?

假设我有一个列族的1B行。限定词是10个字符的字符串。该值为5个字符的字符串。 GC政策:仅最新版本。

原始数据为15 GB,但是当然有很多开销,例如存储长度和时间戳。一个人应该期望多少存储利用率?

如果我有2个这样的家庭怎么办?它会简单地相乘吗?

1 个答案:

答案 0 :(得分:1)

不幸的是,这里没有非常精确的经验法则,但是您应该期望某个地方与逻辑数据大小处于相同的数量级。

如果您的数据可以很好地压缩,事情可能会大大减少,但是以您提到的显而易见的开销来源为模,则事情不会大大增加。如果他们这样做,请告诉我们!

例如,您的示例中一些幼稚的数学预计会为时间戳提供8B / timestamp * 1B = 8GB的额外空间,但请考虑您所有的时间戳可能都在一起,因此可以合理地压缩到一半。如果您的行或行范围包含多个具有相同或接近相同时间戳记的值,则压缩可能会更好。

还请记住,这是每个值的恒定开销,因此,使用较大的值将占总成本的一小部分。而且,当然,即使8GB额外的SSD空间的标价也不到$ 2 / month(https://cloud.google.com/products/calculator/#id=996764ef-d4a4-4043-8016-177c8100a35f