我打算在PostgreSQL中实现Type-2 SCD。 SCD的缺点是,如果经常看到的话,你不能使用引用这些表的外键。换句话说,我经常看到在应用程序代码中处理引用完整性。这让我感到很糟糕,因为可以直接在数据库中完成。添加一些触发器甚至可以隐藏应用程序编码器的实现细节。
我想出了以下架构。这些还好吗?
--
-- One-to-Many
--
BEGIN;
CREATE TABLE document(
id serial not null,
revision integer not null default 1,
title varchar(30),
primary key (id, revision)
);
CREATE TABLE page(
id serial not null,
title varchar(30),
document_id integer not null,
document_revision integer not null,
foreign key (document_id, document_revision) references document(id, revision)
);
-- Insert the first revision
INSERT INTO document (title) VALUES ('my first document');
INSERT INTO page (title, document_id, document_revision) VALUES ('my first page', 1, 1);
-- DEBUG: display
SELECT * FROM document d inner join page p ON ( d.id = p.document_id and d.revision = p.document_revision );
-- "update" the document, by inserting a new revision
INSERT INTO document (id, revision, title) VALUES (1, 2, 'my first document, edited');
-- update the references
UPDATE page SET document_revision = 2 WHERE document_id = 1;
-- DEBUG: display
SELECT * FROM document d inner join page p ON ( d.id = p.document_id and d.revision = p.document_revision );
ROLLBACK;
--
-- Many-to-One
--
BEGIN;
CREATE TABLE page(
id serial not null primary key,
title varchar(30)
);
CREATE TABLE document(
id serial not null,
revision integer not null default 1,
title varchar(30),
page_id integer references page(id),
primary key (id, revision)
);
-- Insert initial revision
INSERT INTO page (title) VALUES ('my first page');
INSERT INTO document (title, page_id) VALUES ('my first document', 1);
INSERT INTO document (title, page_id) VALUES ('my second document', 1);
-- DEBUG: display
SELECT * FROM page p inner join document d on (p.id = d.page_id);
-- destroy the link "from" the old revision
UPDATE document SET page_id = NULL WHERE id=1;
-- Add a new revision, referencing the page
INSERT INTO document ( id, revision, title, page_id ) VALUES ( 1, 2, 'My First Document, edited', 1 );
-- DEBUG: display
SELECT * FROM page p inner join document d on (p.id = d.page_id);
SELECT * FROM document;
ROLLBACK;
--
-- Many-to-Many
--
BEGIN;
CREATE TABLE page(
id serial not null primary key,
title varchar(30)
);
CREATE TABLE document(
id serial not null,
revision integer not null default 1,
title varchar(30),
primary key (id, revision)
);
CREATE TABLE page_contains_document(
page_id integer not null references page(id),
document_id integer not null,
document_revision integer not null,
foreign key (document_id, document_revision) references document( id, revision )
);
-- Insert initial revision
INSERT INTO page (title) VALUES ('My First page');
INSERT INTO document (title) VALUES ('My Fist Document');
INSERT INTO page_contains_document (page_id, document_id, document_revision) VALUES (1, 1, 1);
-- DEBUG: display
SELECT p.title, d.title, d.revision FROM page p INNER JOIN page_contains_document pcd ON (p.id = pcd.page_id) INNER JOIN document d ON (d.id = pcd.document_id and d.revision = pcd.document_revision);
-- Add a new document revision
INSERT INTO document (id, revision, title) VALUES (1, 2, 'My Fist Document, edited');
-- update the reference
UPDATE page_contains_document SET document_revision=2 WHERE document_id=1;
-- DEBUG: display
SELECT p.title, d.title, d.revision FROM page p INNER JOIN page_contains_document pcd ON (p.id = pcd.page_id) INNER JOIN document d ON (d.id = pcd.document_id and d.revision = pcd.document_revision);
ROLLBACK;
答案 0 :(得分:3)
行。我认为我们需要澄清一些关于我们为什么选择SCD 2型的重要误解。
它应该将所有数据保存在一个表中,其中包含日期(不是修订号!)。
所以,你可以:
id , name , valid_from, valid_to
1111 , MyBook , '2009-03-01', '9999-12-31'
After an update:
1111 , Mybook , '2009-03-01', '2009-06-20'
1111 , Mybook , '2009-06-21', '9999-12-31'
“pages”数据库中应存在具有有效日期和有效日期的类似结构。
重点是,现在您可以通过以下方式获取最新版本:
select * from books where valid_to = '9999-12-31'
或者获取4月1日有效的版本
select * from books where valid_to >= '2009-04-01' and valid_from <= '2009-04-01'
同样在您的页面结构中,您只需要存储更新的页面。每个版本都不需要所有页面的新副本。
答案 1 :(得分:3)
我知道对这个问题的回复有点迟了,但我认为这对寻找与你相同的人有用。
我们编写了一个实现SCD-Type 2的模块,该模块与Django一起使用。它是使用PostgreSQL测试的,因此它应该符合您的要求。 它还涵盖了OneToMany-和ManyToMany-关系。
有关详细信息,请在GitHub上查找CleanerVersion或直接转到https://github.com/swisscom/cleanerversion。