我有一个数据集,该数据集在3个不同的群体中分层,并产生以下采样模式:
A B C All
Pop Size 713 2904 4687 8305
Num Sampled 72 135 159
为了使任何统计代表整个分布,我为每个样本群体(A,B,C)创建了权重。
为此,我计算了每个抽样人口的比例,将其除以整个抽样人口的比例,然后对这些人群进行标准化。
Weight 0.16 0.35 0.48
然后我在我的数据集中添加了一列,如下所示:
wt <- c(0.16, 0.35, 0.48)
MyData$Weight <- wt[MyData$PopGroup]
然后,我可以将此权重列与 wtd.hist 或 wtd.mean 函数一起使用,或者在ggplot中使用 weight 美学。< / p>
我无法弄清楚如何对加权数据进行统计测试。具体来说, shapiro.test 和 prop.test 函数都不支持 weight 参数。