按天自动分区-PostgreSQL

时间:2019-04-11 22:59:20

标签: postgresql database-partitioning

我想每天进行分区。我知道与甲骨文是这样的。

CREATE TABLE "PUBLIC"."TEST"     
(   
"ID" NUMBER(38,0) NOT NULL ENABLE, 
"SOME_FIELD" VARCHAR2(20 BYTE) NOT NULL ENABLE,     
"ANOTHER_FIELD" VARCHAR2(36 BYTE) NOT NULL ENABLE,    
TABLESPACE "PUBLIC"."TEST_DATA" 
PARTITION BY RANGE ("TEST_DATE") INTERVAL (NUMTODSINTERVAL(1,'DAY'))  
(PARTITION "TEST_P1"  
VALUES LESS THAN (TIMESTAMP' 2019-01-01 00:00:00')   TABLESPACE "TEST_DATA" );

那PostgreSQL呢?

新编辑: 样本脚本:

该脚本将在一个表中维护前15天的数据,例如“ p1”,而在另一个分区中维护其余天的数据。

1-创建自动分区取决于插入命令的日期范围

2-在脚本中,我还提到了如何在所需列的索引上添加索引。

3-日期范围从1日到14日的数据将添加到分区“ p1”中,其余数据将添加到分区“ p2”中。

示例脚本:

    CREATE TABLE measurement (
        city_id         int not null,
        logdate         date not null,
        peaktemp        int,
        unitsales       int
    );

    CREATE OR REPLACE FUNCTION new_partition_creator() RETURNS trigger AS
  $BODY$
    DECLARE
      partition_date TEXT;
      partition TEXT;
      partition_day int;
      startdate date;
      enddate date;
    BEGIN
      partition_day := to_char(NEW.logdate,'DD');
      partition_date := to_char(NEW.logdate,'YYYY_MM');

         IF partition_day < 15 THEN
      partition := TG_RELNAME || '_' || partition_date || '_p1';
      startdate := to_char(NEW.logdate,'YYYY-MM-01');
      enddate := date_trunc('MONTH', NEW.logdate) + INTERVAL '1 MONTH - 1 day';
      ELSE 
      partition := TG_RELNAME || '_' || partition_date || '_p2';
      startdate := to_char(NEW.logdate,'YYYY-MM-15');
      enddate := date_trunc('MONTH', NEW.logdate) + INTERVAL '1 MONTH - 1 day';
      END IF;

      IF NOT EXISTS(SELECT relname FROM pg_class WHERE relname=partition) THEN
        RAISE NOTICE 'A partition has been created %',partition;
        EXECUTE 'CREATE TABLE ' || partition || ' ( CHECK ( logdate >= DATE ''' || startdate || '''  AND logdate <=  DATE ''' ||  enddate || ''' )) INHERITS (' || TG_RELNAME || ');';
        EXECUTE 'CREATE INDEX ' || partition || '_logdate ON '  || partition || '(logdate)';
        EXECUTE 'ALTER TABLE ' || partition || ' add primary key(city_id);';       
        END IF;
        EXECUTE 'INSERT INTO ' || partition || ' SELECT(' || TG_RELNAME || ' ' || quote_literal(NEW) || ').* RETURNING city_id;';
      RETURN NULL;
    END;
  $BODY$
LANGUAGE plpgsql VOLATILE
COST 100; 


    CREATE TRIGGER testing_partition_insert_trigger BEFORE INSERT ON measurement FOR EACH ROW EXECUTE PROCEDURE new_partition_creator();


    postgres=# insert into measurement values(1,'2017-10-11',10,10);
    NOTICE:  A partition has been created measurement_2017_10_p1
    INSERT 0 0

3 个答案:

答案 0 :(得分:5)

从 Postgres 12 开始,支持按范围分区。 但是,不支持自动创建分区(如 Oracle 的间隔)。您必须手动创建每个分区。

Postgres 中的分区概念也与 Oracle 不同。在 Oracle 中分区被认为是一个对象,而在 Postgres 中,分区被认为是一个表。在 Postgres 中,分区表本身不包含数据。它由分区组成。

表格创建:

CREATE TABLE TEST (
ID INT NOT NULL,
LOG_DATE DATE)
PARTITION BY RANGE (LOG_DATE);

分区创建:

CREATE TABLE TEST_MAR21 
PARTITION OF TEST
FOR VALUES FROM ('01-MAR-2021') TO ('31-MAR-2021');

CREATE TABLE TEST_APR21 
PARTITION OF TEST
FOR VALUES FROM ('01-APR-2021') TO ('30-APR-2021');

请参阅 https://www.postgresql.org/docs/current/ddl-partitioning.html 以获取完整文档

答案 1 :(得分:0)

Postgres确实支持对值进行分区。但是,它不是自动的,因为您需要在创建基表后手动创建分区,从Postgres 10开始,它们不会自动生成。

请参见以下链接:https://www.postgresql.org/docs/10/ddl-partitioning.html

看看这个例子是否有意义:

CREATE TABLE PartTest
(
    idx INTEGER,
    partMe Date
) PARTITION BY LIST (partMe);

CREATE TABLE PartTest_2019_04_11 PARTITION OF PartTest
    FOR VALUES IN ('2019-04-11');

答案 2 :(得分:0)

您可以使用扩展名pg_partman来自动创建分区。 https://github.com/pgpartman/pg_partman

或者您甚至可以使用调度程序pg_agent,在其中每天18:00:00执行一个过程以创建第二天的分区。