Question

我有一份年度患者索赔数据集，其中每位患者可以多次出庭，因为他每年可以有多次索赔（即：如果一年中分娩两次，女性可以有两次索赔）。

我想计算每个患者ID重复的次数，但我不想删除重复项或将它们从数据集中删除。是否有不同的代码来执行此操作？

谢谢！

Answer 1

data work.claims_data;
input patient_id $ claim_number $;
datalines;
P1 C1
P1 C2
P1 C3
;
run;

proc sql;
select patient_id,count(distinct claim_number) - 1 as cnt
from claims_data
group by patient_id
having cnt > 0;
quit;

工作：上面的SQL程序将为患者提供输入数据集中不同声明号的明智计数。如果我们从每个计数中减去1，将为每位患者提供重复索赔计数。

输出：

Patient_ID    cnt
        P1      2

在不删除* SAS *的情况下计算变量中的重复观察值

1 个答案: