我有2个数据集。 1包含列origin_zip(数字)和destination_zip(char)和tracking_number(char),另一个包含zip。
我想比较这两个数据集,这样我就可以看到第二个数据集的zip列中没有的所有跟踪号和destination_zips。
此外,我想查看origin_zips = destination_zips所有的tracking_numbers和origin_zips。
我将如何做到这一点?
origin_zip destination_zip tracking_number
12345 23456 11111
34567 45678 22222
12345 12345 33333
zip
12345
34567
23456
results_tracking_number
22222
33333
答案 0 :(得分:0)
让我们从这开始......我不认为这完全回答了你的问题,但是跟进评论,如果可以,我会帮助......
data zips;
input origin_zip $ destination_zip $ tracking_number $;
datalines;
12345 23456 11111
34567 45678 22222
56789 12345 33333
;
data zip;
input zip $;
datalines;
12345
54321
34567
76543
56789
;
Proc sort data=zips;
by origin_zip;
run;
Proc sort data=zip;
by zip;
run;
Data contained not_contained;
merge zip(in=a) zips(in=b rename=(origin_zip=zip));
by zip;
if a and b then output contained;
if a and not b then output not_contained;
run;