计算元组大小

时间:2015-07-10 05:08:04

标签: postgresql database-design storage

我试图理解列顺序如何最小化PostgreSQL中的表大小。

示例:

CREATE TABLE test (
 column_1 int
,column_2 int
,column_3 bigint
,column_4 bigint
,column_5 text
,column_6 text
,column_7 numeric(5,2)
,column_8 numeric(5,2)
,column_9 timestamp
,column_10 boolean
,column_11 boolean
);

INSERT INTO test
  VALUES(1,1,1,1,'test','test_1',12,12,current_timestamp,true,false);

SELECT pg_column_size(test.*) FROM test;

 pg_column_size 
----------------
       82
    (1 row)

元组大小:

元组头的23字节开销+ NULL位图的1字节,所以:

24 + 4 + 4 + 8 + 8 + 5 + 7 + 5 + 5 + 8 + 1 + 1 = 80但实际元组大小为82.

是否有2字节的额外开销?

我理解下面链接给出的例子:
Calculating and saving space in PostgreSQL

如果我们删除column_8 numeric(5,2),那么元组大小也保持不变,即:82。

我重新排序表以最小化元组大小并给出80。

CREATE TABLE test (
 column_3 bigint
,column_4 bigint
,column_9 timestamp
,column_1 int
,column_2 int
,column_10 boolean
,column_11 boolean
,column_7 numeric(5,2)
,column_8 numeric(5,2)
,column_5 text
,column_6 text);

INSERT INTO test
  VALUES(1,1,current_timestamp,1,1,true,false,12,12,'test','test_1');

SELECT pg_column_size(test) FROM test;

 pg_column_size 
----------------
      80

对PostgreSQL中的列顺序有什么建议吗?

1 个答案:

答案 0 :(得分:7)

你错过了column_9 timestamp之前的另外2个字节的填充,需要以8个字节的倍数开始。

24+4+4+8+8+5+7+5+5+8+1+1=80 but the actual tuple size is 82.  
------------------^ <----- 2 bytes of padding here

这也是原因:

  

如果我们删除column_8 numeric(5,2),那么也删除元组大小   保持不变,即:82。

取出占用5个字节的列后,在同一位置获得7个字节的填充 - 最糟糕的情况。

另请注意,此行实际上占用磁盘上的 88个字节,因为下一个元组的元组头是左对齐的(从MAXALIGN的倍数开始,通常为8个字节)。

您修改的行以8个字节的倍数结束,不会产生额外的填充,只需要80个字节。

但是,对于页眉中的元组指针,两者都需要另外4个字节。

这是一个“专栏俄罗斯方块”的游戏,你似乎已经理解了它的基础知识。通常情况下你不会获得太多收益,不要过于考虑它。但是,有极端的角落案件。空值会改变游戏每行

您需要知道每种数据类型的大小,对齐和填充要求以及NULL位图的特殊规则。

关于dba.SE的详细计算的相关答案: