我有一份年度患者索赔数据集,其中每位患者可以多次出庭,因为他每年可以有多次索赔(即:如果一年中分娩两次,女性可以有两次索赔) 。
我想计算每个患者ID重复的次数,但我不想删除重复项或将它们从数据集中删除。是否有不同的代码来执行此操作?
谢谢!
答案 0 :(得分:0)
data work.claims_data;
input patient_id $ claim_number $;
datalines;
P1 C1
P1 C2
P1 C3
;
run;
proc sql;
select patient_id,count(distinct claim_number) - 1 as cnt
from claims_data
group by patient_id
having cnt > 0;
quit;
工作:上面的SQL程序将为患者提供输入数据集中不同声明号的明智计数。如果我们从每个计数中减去1,将为每位患者提供重复索赔计数。
输出:
Patient_ID cnt
P1 2