Question

我已使用nodupkey功能从数据集中删除了重复项，但希望将删除的重复项与保留的第一个观察值进行比较。

proc sort data=matchedfile dupout=deletedduplicate nodupkey 
out=dedupedfile;
by ID;
run;

我们需要一个数据集，它结合了重复的所有观察结果，重复文件中删除的重复项以及重复数据删除文件中具有相同ID的观察结果。

谢谢！

Answer 1

如果您的问题是您希望“未删除”＆＃39;排除＆＃39;删除＆＃39;行，您可以使用SAS 9.3中添加的NOUNIKEY选项。它与NODUPKEY相反 - 只保留非唯一的记录 - 并删除唯一记录。您可以删除那些已删除的唯一记录（如果您将单独执行不同的查询以获取它们），或者您可以使用UNIQUEOUT将它们放入数据集中。

proc sort data=have out=dups nounikey uniqueout=nodups;
  by whatever;
run;

有关详细信息，请参阅PROC SORT documentation。

如何使用SAS中的重复变量创建数据集

1 个答案: