比较数据集

时间:2012-03-22 18:41:58

标签: sas

我有2个数据集。 1包含列origin_zip(数字)和destination_zip(char)和tracking_number(char),另一个包含zip。

我想比较这两个数据集,这样我就可以看到第二个数据集的zip列中没有的所有跟踪号和destination_zips。

此外,我想查看origin_zips = destination_zips所有的tracking_numbers和origin_zips。

我将如何做到这一点?

origin_zip    destination_zip    tracking_number
12345         23456              11111
34567         45678              22222
12345         12345              33333

zip
12345
34567
23456

results_tracking_number
22222
33333

1 个答案:

答案 0 :(得分:0)

让我们从这开始......我不认为这完全回答了你的问题,但是跟进评论,如果可以,我会帮助......

data zips;
input origin_zip $ destination_zip $ tracking_number $;
datalines;
12345         23456              11111
34567         45678              22222
56789         12345              33333
;

data zip;
input zip $;
datalines;
12345
54321
34567
76543
56789
;

Proc sort data=zips;
by origin_zip;
run;

Proc sort data=zip;
by zip;
run;

Data contained not_contained;
merge zip(in=a) zips(in=b rename=(origin_zip=zip));
by zip;
if a and b then output contained;
if a and not b then output not_contained;
run;