如何在雪花中生成表和表的列的统计信息?

时间:2019-11-22 06:56:27

标签: sql snowflake-data-warehouse

是否有可用的功能(如Netezza中的Generate Statistics)在雪花中生成列元数据(重复项,唯一值,最小值,最大值等)。

2 个答案:

答案 0 :(得分:0)

不,不是。

您有TABLES View,其中包含大小(存储)和行数,
但其余信息(包括COLUMNS View)与 schema 元数据有关,与 data 元数据无关。

另一方面,表结构本身(也称为micro-partitions)包含表元数据,这些表元数据使MIN()MAX()功能非常有效。一些表统计信息可能会全局缓存(即,在Snowflake architecture的Cloud Services部分中)

答案 1 :(得分:0)

谢谢您关于雪花收集统计信息的问题。一些信息:

  1. 在数据加载期间(所有DML(例如COPY,INSERT / UPDATE / DELETE)), 这些统计信息已经由Snowflake在 微分区级别。
  2. 在查询处理期间,这些统计信息会自动利用 由我们的优化程序提高查询性能。
  3. 自动背景 自动群集服务之类的服务(如果已为给定启用 表)也将持续不断地进行微调 具有这些统计信息的表的聚簇质量。

所有这些自动魔术功能都是在无需用户手动干预的情况下发生的(因此,为什么Snowflake被称为自调整,易于使用的数据仓库平台)。