计算重复变量的平均数

时间:2015-02-24 20:43:59

标签: count sas average frequency

我有一个包含重复的唯一患者ID(~250,000)的数据集。我想计算每个唯一RID出现的平均次数。我只能弄清楚如何计算每个唯一RID出现的实际次数:

proc freq data=patients;
tables rid;
run;
IE:我不想知道
RID 1出现2
RID 2出现4
RID 3出现3

我想知道唯一RID出现的平均数是3。

感谢您的帮助!

2 个答案:

答案 0 :(得分:1)

数学上即记录总数除以唯一的RID数。

您可以使用带有COUNT DISTINCT和COUNT的SQL,只需一步即可完成此操作。

答案 1 :(得分:0)

您可以通过PROC SQL实现此目的

Select count(*)/count(distinct rid)
from patients;