通过标志从sas中的多个数据集中查找重复项

时间:2015-10-06 17:36:31

标签: sas duplicates

我有一个像这样安排的数据集:

ID  Date  Flag
A  1/1/11 000
A  1/1/11 001
A  1/1/11 010
B  1/2/11 000
B  1/3/11 001

我设置了一个标记来跟踪某些列并将原始数据集分成四个较小的列。因此,一个用于flag ='000',一个用于'001',一个用于'010'和'011'。如果我按ID和日期进行唯一计数,我会说原始数据集为500。但是对于每个单独的一个标记,如果我加总,我得到说600.这意味着100个记录是重复的,所以在我上面的例子A与1/1/11只有1个唯一记录,但它出现在子数据集'000','010','001'。因此,在100个额外的副本中,3个将是A,日期为1/1/11。有没有一种方法可以解决这个问题,而无需手动查看哪些记录是重复的?

0 个答案:

没有答案