关于雪花微分区大小的说明?

时间:2021-06-12 03:43:35

标签: snowflake-cloud-data-platform

我需要澄清一下雪花微分区大小的大小。在snowflake官方文档中,提到如下。

<块引用>

每个微分区包含 50 MB 到 500 MB 的未压缩数据(请注意,Snowflake 中的实际大小较小,因为数据始终以压缩方式存储)。

但是在某些地方,我看到以下关于微分区大小的声明。

<块引用>

Snowflake 还将多行存储在微分区中,这些微分区是大约 16 Mb 大小的可变长度数据块

Micro-partition 可以容纳 16 MB 或 (50 -500 MB) 的数据大小是多少,否则每个 Micro-partition 是否有 16 MB 的数据块?

1 个答案:

答案 0 :(得分:0)

关键是压缩

Benefits of Micro-partitioning

<块引用>

顾名思义,微分区的尺寸很小(压缩前为 50 到 500 MB),这可以实现极其高效的 DML 和细粒度修剪以加快查询速度。

列也在微分区中单独压缩。 Snowflake 会自动为每个微分区中的列确定最有效的压缩算法。

50-500MB 的大小用于未压缩的数据,而微分区本身大约有 16MB(压缩后)。