我正在尝试将两个数据集合并到很多相同的观察中,除了一个列有更多列。 数据集1包含20%观察值的数据,而数据集2包含其他80%的观察值(+一列额外值)。如果我运行下面的代码,当我用315观察合并两个数据集时,我得到4037个观察值!
proc sql;
create table RateExposure as
select *
from Dataset1, Dataset2
where Dataset1.ID = Dataset2.ID
order by Dataset1.ID;
quit;
如果我跑
data newDataset;
merge Dataset1 Dataset2;
by ID;
run;
我只能观察其中一个数据集 - 这怎么可能?
答案 0 :(得分:0)
试试这个:
PROC SQL;
CREATE TABLE result AS
SELECT t1.*, t2.extra_column
FROM Dataset1 AS t1
INNER JOIN Dataset2 AS t2 ON (t1.ID = t2.ID)
;
QUIT;