我目前在SAS(> 100000)中有大量对象,每个对象包含大约60列数据,包括ID号。这组数据中有许多重复的ID号。我的目标是使用我拥有的一个软件将我当前拥有的ID号转换为另一种ID号。问题是,当我将ID号输入到软件中时,转换后的输出会返回,而不需要重复,这是我需要的。有没有办法使用输出ID号以某种方式创建输出ID列表,除了原始数据集的重复项。任何语言或软件都可以。
以下是我上面描述的内容。
原始ID:086516 677240 449370 677240 941053 449370
输出:147244 147947 147957 148021
首选输出:147244 147947 147957 147947 148021 147957
答案 0 :(得分:1)
您可以使用MERGE语句合并ID,并将值附加到具有相同ID值的每个记录。
data want;
merge have(in=a) newIDs(in=b);
by id;
if a and b;
run;