我需要使用SAS或R为0或1或null且说明未知值的变量计算费率/百分比的置信区间。比率为(计数1 /总和(计数0加上空计数))。单位总数为7,500。就上下文而言,它们代表一个人执行的实验室值,如果它们具有正值,则为1。以下示例代表每个人的最后一个实验室值,但我也为每个人提供了所有实验室值-其中可能有1,0,null和未知数。
示例:
CELL()
这是示例输出的SAS代码:
Var, Count, Total, Rate, CI (95%)
1, 2500, 7500, 0.33, [0.30,0.37]
0, 3400, 7500, 0.45,[0.40,0.50]
., 1600,7500,0.21,[0.19,0.22]
我知道Var = 1的比率实际上不是33%,应该是80%左右,但是问题是缺少值和我们没有的值。除了空值,我们还缺少所有单元的缺失数据(此信息是我所拥有的,完整的数据集不是公开的)。
因此,我实质上是在试图对所有变量的“猜测”到预测的80-85%的比率,其置信区间包括上述计算的比率。
使用这样的数据布局,是否可以投影?除了缺失的值,我还需要什么?我该如何预测Var = 1的33%是我们所知道的一半?我应该为每个人使用所有值,而不是最后一个值吗?
本质上,我需要构造以下内容,其中Y轴为比率/百分比: https://www.researchgate.net/profile/Kristien_Wouters2/publication/283324353/figure/fig1/AS:614178628829196@1523443004471/Mean-viral-load-and-95-confidence-interval-CI-of-Drug-Resource-Enhancement-Against.png
感谢您的帮助。