Question

我有一个包含重复的唯一患者ID（~250,000）的数据集。我想计算每个唯一RID出现的平均次数。我只能弄清楚如何计算每个唯一RID出现的实际次数：

proc freq data=patients;
tables rid;
run;

IE：我不想知道
RID 1出现2
RID 2出现4
RID 3出现3

我想知道唯一RID出现的平均数是3。

感谢您的帮助！

Answer 1

数学上即记录总数除以唯一的RID数。

您可以使用带有COUNT DISTINCT和COUNT的SQL，只需一步即可完成此操作。

Answer 2

您可以通过PROC SQL实现此目的

Select count(*)/count(distinct rid)
from patients;