在不删除* SAS *的情况下计算变量中的重复观察值

时间:2015-02-11 02:09:38

标签: duplicates sas frequency

我有一份年度患者索赔数据集,其中每位患者可以多次出庭,因为他每年可以有多次索赔(即:如果一年中分娩两次,女性可以有两次索赔) 。

我想计算每个患者ID重复的次数,但我不想删除重复项或将它们从数据集中删除。是否有不同的代码来执行此操作?

谢谢!

1 个答案:

答案 0 :(得分:0)

data work.claims_data;
input patient_id $ claim_number $;
datalines;
P1 C1
P1 C2
P1 C3
;
run;

proc sql;
select patient_id,count(distinct claim_number) - 1 as cnt
from claims_data
group by patient_id
having cnt > 0;
quit;

工作:上面的SQL程序将为患者提供输入数据集中不同声明号的明智计数。如果我们从每个计数中减去1,将为每位患者提供重复索赔计数。

输出:

Patient_ID    cnt
        P1      2