如何使用SAS中的重复变量创建数据集

时间:2016-11-04 20:08:16

标签: sas duplicates

我已使用nodupkey功能从数据集中删除了重复项,但希望将删除的重复项与保留的第一个观察值进行比较。

proc sort data=matchedfile dupout=deletedduplicate nodupkey 
out=dedupedfile;
by ID;
run;

我们需要一个数据集,它结合了重复的所有观察结果,重复文件中删除的重复项以及重复数据删除文件中具有相同ID的观察结果。

谢谢!

1 个答案:

答案 0 :(得分:0)

如果您的问题是您希望“未删除”'排除'删除'行,您可以使用SAS 9.3中添加的NOUNIKEY选项。它与NODUPKEY相反 - 只保留非唯一的记录 - 并删除唯一记录。您可以删除那些已删除的唯一记录(如果您将单独执行不同的查询以获取它们),或者您可以使用UNIQUEOUT将它们放入数据集中。

proc sort data=have out=dups nounikey uniqueout=nodups;
  by whatever;
run;

有关详细信息,请参阅PROC SORT documentation