我需要澄清一下雪花微分区大小的大小。在snowflake官方文档中,提到如下。
<块引用>每个微分区包含 50 MB 到 500 MB 的未压缩数据(请注意,Snowflake 中的实际大小较小,因为数据始终以压缩方式存储)。
但是在某些地方,我看到以下关于微分区大小的声明。
<块引用>Snowflake 还将多行存储在微分区中,这些微分区是大约 16 Mb 大小的可变长度数据块
Micro-partition 可以容纳 16 MB 或 (50 -500 MB) 的数据大小是多少,否则每个 Micro-partition 是否有 16 MB 的数据块?
答案 0 :(得分:0)
关键是压缩:
Benefits of Micro-partitioning
<块引用>顾名思义,微分区的尺寸很小(压缩前为 50 到 500 MB),这可以实现极其高效的 DML 和细粒度修剪以加快查询速度。
列也在微分区中单独压缩。 Snowflake 会自动为每个微分区中的列确定最有效的压缩算法。
50-500MB 的大小用于未压缩的数据,而微分区本身大约有 16MB(压缩后)。