Amazon Redshift如何存储空值

时间:2016-08-23 16:14:36

标签: amazon-redshift

在Amazon Redshift中,如何存储空值? - 他们会占用物理空间吗?

我正在寻找如何最好地设计一个表 - 它背后的数据可能意味着它将有许多人口稀疏的列,所以我想知道这是否有负面影响(即使在压缩后)或如果nulls实际上根本没有占用任何空间(例如像mysql中的v5.0.3或更高版本)

谢谢

1 个答案:

答案 0 :(得分:2)

是的,具有大量空值的列将提供出色的压缩效果,从而在Amazon Redshift上提供出色的性能。

Amazon Redshift is a columnar database engine. Columnar database are greatly optimized for data with repeating values, and those can be null.

因此,如果你有一个表,其中一些列有很多空值,这很可能压缩得非常好,并且可以节省存储空间和处理速度。

为了实现正确的压缩,您有两种选择:

  1. DDL Design - Manually choose your encoding settings.
  2. Automatic - Have the copy command automatically choose the optimal encoding settings for your database.