我已使用nodupkey功能从数据集中删除了重复项,但希望将删除的重复项与保留的第一个观察值进行比较。
proc sort data=matchedfile dupout=deletedduplicate nodupkey
out=dedupedfile;
by ID;
run;
我们需要一个数据集,它结合了重复的所有观察结果,重复文件中删除的重复项以及重复数据删除文件中具有相同ID的观察结果。
谢谢!
答案 0 :(得分:0)
如果您的问题是您希望“未删除”'排除'删除'行,您可以使用SAS 9.3中添加的NOUNIKEY
选项。它与NODUPKEY
相反 - 只保留非唯一的记录 - 并删除唯一记录。您可以删除那些已删除的唯一记录(如果您将单独执行不同的查询以获取它们),或者您可以使用UNIQUEOUT
将它们放入数据集中。
proc sort data=have out=dups nounikey uniqueout=nodups;
by whatever;
run;
有关详细信息,请参阅PROC SORT documentation。