计算数据库中不存在但在另一个数据库中存在的观察结果

时间:2018-06-07 10:40:46

标签: dataframe sas

我对SAS有点生疏(我已经好几年没用了),我可以帮忙。

这是我拥有的两个数据库:

时间t:

data data1;
infile DATALINES DLM=" ";
input id_worker id_firm;
datalines;
1 11 
2 11 
3 11 
4 12 
5 12 
6 12 
7 12 
8 13 
9 13 
10 13
;
run;

时间t + 1:

data data2;
infile DATALINES DLM=" ";
input id_worker id_firm;
datalines;
1 12 
2 11 
3 11 
4 12 
5 12 
6 12 
7 12 
8 14 
9 14 
11 11
;
run;

我想计算,每个id_firm在t + 1中存在但不在t + 1中的工作者数量,并将结果放在t + 1数据库中的变量“count”中,例如:

data data2;
infile DATALINES DLM=" ";
input id_worker id_firm count;
datalines;
1 12 0
2 11 1
3 11 1
4 12 0
5 12 0
6 12 0
7 12 0
8 14 0
9 14 0
11 11 1
;
run;

在旁注中,我必须在15个时间段内完成此操作,对于每个时期,数据库有数百万个观察值和大约一百个变量。

谢谢!

0 个答案:

没有答案