我对Postgresql和Python很新,我在理解外键时遇到了一些问题(我认为这是我在这里使用的)。我看过here的一个例子,但我认为这不是我需要的
作为一个简单的例子,我在现有表中有一些信息:
[ID REFERENCE REF_AGE DATA1 DATA 2]
[1 JOHN 50 50 60 ]
[2 JOHN 50 55 30 ]
[3 TOM 60 60 10 ]
[4 MATT 30 76 57 ]
[5 MATT 30 45 47 ]
我想从中制作两个新表。一个包含ID和数据,其中reference_id链接到另一个新表 - 一个参考表,我可以存储有关每个参考的其他信息(例如上面的年龄)。
表1:
[ID REF_ID DATA1 DATA 2]
[1 1 50 60 ]
[2 1 55 30 ]
[3 2 60 10 ]
[4 3 76 57 ]
[5 3 45 47 ]
表2:
[REF_ID NAME AGE ]
[1 JOHN 50 ]
[2 TOM 60 ]
[3 MATT 30 ]
有人能告诉我如何拆分这样的现有数据吗?将唯一值与原始表引用列分隔到新引用表中,并将相应的ref_id插入另一个新表中?
答案 0 :(得分:2)
有食谱。但如果人名不是唯一的,那你就会遇到问题。
drop table if exists not_normalized cascade;
create table not_normalized (
id int, reference text, ref_age int, data1 int, data2 int
);
insert into not_normalized (id, reference, ref_age, data1, data2) values
(1,'JOHN',50,50, 60 ),
(2,'JOHN',50,55, 30 ),
(3,'TOM',60,60, 10 ),
(4,'MATT',30,76, 57 ),
(5,'MATT',30,45, 47 ),
(6,null,null,42,50);
drop table if exists referenced cascade;
create table referenced (
ref_id serial primary key,
name text,
age int
);
选择不同的对(名称,年龄)可以最大限度地减少名称冲突问题:
insert into referenced (name, age)
select distinct reference, ref_age
from not_normalized
where (reference, ref_age) is not null
;
table referenced;
reference | ref_age
-----------+---------
JOHN | 50
TOM | 60
MATT | 30
drop table if exists referencer;
create table referencer (
id serial primary key,
ref_id int references referenced (ref_id),
data1 int, data2 int
);
再次使用年龄来减少碰撞:
insert into referencer (ref_id, data1, data2)
select r.ref_id, data1, data2
from
not_normalized nn
left join
referenced r on r.name = nn.reference and r.age = nn.ref_age
;
table referencer;
id | ref_id | data1 | data2
----+--------+-------+-------
1 | 1 | 50 | 60
2 | 1 | 55 | 30
3 | 3 | 76 | 57
4 | 3 | 45 | 47
5 | 2 | 60 | 10
6 | | 42 | 50