我有一个包含重复的唯一患者ID(~250,000)的数据集。我想计算每个唯一RID出现的平均次数。我只能弄清楚如何计算每个唯一RID出现的实际次数:
proc freq data=patients;
tables rid;
run;
IE:我不想知道
我想知道唯一RID出现的平均数是3。
感谢您的帮助!
答案 0 :(得分:1)
数学上即记录总数除以唯一的RID数。
您可以使用带有COUNT DISTINCT和COUNT的SQL,只需一步即可完成此操作。
答案 1 :(得分:0)
您可以通过PROC SQL实现此目的
Select count(*)/count(distinct rid)
from patients;